考虑Unicode Charts中C1控制字符和Latin-1补充的unicode图表。如果一个字符有字形,它会被显示出来;如果没有字形,则会给出特殊的点线和符号标记或标识符。在这种情况下,0080和0081似乎都有一些“无效标记”,我认为这就是“XXX”的含义。这是它的含义吗?
- 许多ANSI代码页中的字节值128是欧元标记。 - 存储128的十进制值等同于存储U+20AC?
我在特定语言或操作系统API实现的MBCS和Unicode类型以及Java的有趣处理中遇到的神奇“非正交性”让我想知道U+0080字符的真正预期用途是什么。这个参考链接让我困惑,因为它显示Java将此字符视为欧元符号(ANSI代码页到Unicode的单向友好性),但它的名称是
- 许多ANSI代码页中的字节值128是欧元标记。 - 存储128的十进制值等同于存储U+20AC?
我在特定语言或操作系统API实现的MBCS和Unicode类型以及Java的有趣处理中遇到的神奇“非正交性”让我想知道U+0080字符的真正预期用途是什么。这个参考链接让我困惑,因为它显示Java将此字符视为欧元符号(ANSI代码页到Unicode的单向友好性),但它的名称是
<control>
,这不是我知道如何处理的任何内容。维基百科说它是PAD
这里。
有人能帮我吗?我在Unicode学校跳过了基础概念日吗?我错过了什么?
更新 从0080到0098的块是不可打印的控制字符。这一点我知道。我想知道的是XXX是什么意思,当我处理具有该值的Unicode数据时,我应该如何考虑此字符?