我正在进行文字解码。 我试图找到ASCII编码中 —
字符的字符代码,注意不要与-
混淆。我曾尝试过但没成功。 有人知道如何转换吗?
我正在进行文字解码。 我试图找到ASCII编码中 —
字符的字符代码,注意不要与-
混淆。我曾尝试过但没成功。 有人知道如何转换吗?
来自维基百科的引用 (Em dash)
当实际的破折号不可用时 -- 如在ASCII字符集中 -- 会使用双短线 ("--") 或三个连续的短横线 ("---")。在Unicode中,破折号是U + 2014(十进制值8212)。
破折号字符不属于ASCII字符集。
char check = s.charAt(0)
,当s=—
时,我会得到什么?你是说如果我执行int check = s.charAt(0)
,我会得到8212吗? - Adam Shs.charAt(0)
,那么您将得到破折号,这将等于s = '\u2014'
。 - thomasrutter—
被称为破折号(Em Dash),其字符代码是\u2014
。它不是ASCII字符,因此您不能使用ASCII字符集对其进行解码,因为它不在ASCII字符表中。您可能想要使用UTF8。
\u2014
形式检查其Unicode代码点。 - thomasrutter对于带数字键盘的Windows电脑:
使用数字键盘输入Alt+0150(短横线),Alt+0151(长横线)或Alt+8722(减号)。
—
不属于ASCII字符集。
U+2014