我对编码有些困惑。据我所知,旧的ASCII字符每个字符占用一个字节。一个Unicode字符需要多少字节呢?
我认为一个Unicode字符可以包含任何语言中的所有可能字符 - 我是正确的吗?那么每个字符需要多少字节呢?
UTF-7、UTF-6、UTF-16等是什么意思?它们是不同版本的Unicode吗?
我看过维基百科关于Unicode的文章,但我觉得很难理解。期待能够得到简单明了的回答。
我对编码有些困惑。据我所知,旧的ASCII字符每个字符占用一个字节。一个Unicode字符需要多少字节呢?
我认为一个Unicode字符可以包含任何语言中的所有可能字符 - 我是正确的吗?那么每个字符需要多少字节呢?
UTF-7、UTF-6、UTF-16等是什么意思?它们是不同版本的Unicode吗?
我看过维基百科关于Unicode的文章,但我觉得很难理解。期待能够得到简单明了的回答。
来自维基百科:
UTF-8是一种8位可变宽度编码,最大限度地兼容ASCII;
UTF-16是一种16位可变宽度编码;
UTF-32是一种32位固定宽度编码。
这是三种最流行的不同编码。
看看这个Unicode代码转换器。例如,在“0x…符号”字段中输入2009是细间距的Unicode编号的0x2009
,然后单击转换。十六进制数E2 80 89
(3个字节)将出现在“UTF-8代码单元”字段中。