在C#中,如何表示4字节的字符

9

在C#中,4字节的字符是如何表示的?像一个字符还是一组2个字符?

var someCharacter = 'x'; //put 4 bytes UTF-16 character

你能举个“4字节字符”的例子吗?这会让你的问题更清晰明了。 - jv42
@jv42,有一些UTF-16字符无法用2个字节表示。因此,任何代码超出2^16的字符都是如此。 - SiberianGuy
2
请参阅Jon Skeet的“Unicode和.NET”文章- http://csharpindepth.com/Articles/General/Unicode.aspx - sll
我知道那些字符存在,提供一个例子可以确保问题中没有拼写错误,特别是因为“char”和“character”的含义有时会令人困惑。 - jv42
1个回答

15

C# 只能使用 char 类型存储来自基本多文种平面的字符。对于平面之外的字符,需要使用两个称为代理项字符char

还可以使用字符串字面量,例如:

string s = "\U0001D11E";

参见UTF-16


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接