- iso-8859-1 是 utf-8 的一个合适的子集吗?
- 那 iso-8859-n 呢?
- 那 windows-1252 呢?
如果上述任何一个答案是否定的,那么不相交的字符是什么?我正在测试检测字符集的逻辑,并希望编写测试以验证检测是否正常工作。
如果上述任何一个答案是否定的,那么不相交的字符是什么?我正在测试检测字符集的逻辑,并希望编写测试以验证检测是否正常工作。
ISO-8859-1是否是UTF-8的一个合适子集?
ISO-8859-1(Unicode的前256个字符)的字符报告是UTF-8(每个Unicode字符)的一个合适子集。
然而,字符U+0080到U+00FF在这两种编码中的编码方式不同。
80
到FF
分配给一个单字节。C2 80
到C3 BF
。那么iso-8859-n呢?
这些是包含614个不同字符的15种不同编码。其中一些字符出现在ISO 8859的多个“部分”中,而有些则没有。您需要更具体地说明。
我看到你的问题标记为ISO-8859-2。在-2中而不在-1中的字符是: