XML中的Unicode字符串

16

在XML中,Unicode使用以下方式表示:

例如:

\ue349 

如果我想写一个由Unicode字符e343和e312组成的字符串,该如何在XML中表示?


3
XML中Unicode字符的表示方法与您展示的Java中不同。在XML中,数字引用使用表示。 - Joachim Sauer
我曾经在安卓上使用它..现在如何将其作为字符串使用? - Noha Nhe
2个回答

26

XML不使用\ue349标记。可以使用以&#开头的字符引用,但大多数情况下并不需要使用它们。通常情况下,XML与UTF-8字符编码一起使用,这样每个字符都可以直接写入。 (在程序中生成XML时,如果编程语言支持,可能会使用像\ue349这样的标记。)

在Unicode中,数字E343和E312是专用代码点,标准未分配给任何字符。它们可以按照需要通过私人协议使用,但您不应该期望任何软件或任何人能够理解它们,除非有这样的协议存在。考虑到这一点,代码点U+E343 U+E312(因此是某些协议可以表示的字符)可以写为


2
U+D8E1是一个保留(未分配)的代码点。这意味着没有字符被分配给它,且不得使用;如果未来版本的标准指定了一个字符,则情况可能会改变。字体供应商有时会使用保留的代码点,但这违反了标准且产生不可预测的影响。参考:http://www.unicode.org/versions/latest/ch03.pdf#G2212 - Jukka K. Korpela
2
U+D8E1是代理字符,一种编码Unicode基本多文种平面之外字符的方式;一个很好的例子是Emoji字符U+1F600 GRINNING FACE。代理字符成对使用;例如,U+1F600可以被编码为UCS-2字符U+D83D U+DE00。 - Anthony Mills

16

<node>&#xE343;&#xE312;</node>


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接