ASCII兼容和非兼容字符编码

5

有没有一种字符编码的例子与ASCII不兼容?为什么不兼容?

此外,除了UTF和ISO8859(我已经知道了),还有哪些编码具有向上兼容ASCII的特性?为什么?


“兼容”是什么意思?用一个字符集和编码方式编写的文本,用错误的字符集和编码方式进行阅读?此外,“UTF”是什么意思?如果将ASCII作为UTF-16或UTF-32进行阅读,则可能会出现解码错误。 - Tom Blodget
1个回答

6

存在基于EBCDIC的编码,它们与ASCII不兼容。例如,我最近遇到一封使用CP1026(也称为EBCDIC 1026)编码的电子邮件。如果您查看其字符表,字母和数字的编码偏移与ASCII非常不同。这会导致我的电子邮件解析器出现问题,特别是因为LF被编码为0x25而不是ASCII中的0x0A。


谢谢,还有其他前向兼容编码的例子吗? - François Richard
1
最常用的编码方式完全兼容ASCII(ISO8859-X / Latin-X,GB 18030,Big5等),或者至少大部分与ASCII兼容(SHIFT-JIS等)。现在很少使用EBCDIC编码。 - Remy Lebeau
1
Shift-JIS 是一个棘手的编码,因为 ¥ 存在于 0x5c 的位置,而通常 \ 会在那里。 - Craig Ringer
3
@CraigRinger Shift-Jis编码中,0x7E位置上的'~'字符被替换成了一个上划线(U+203E)字符。此外,还有ISO-2022编码,它使用ASCII转义序列在单字节和多字节模式之间进行切换。 - Remy Lebeau

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接