举例
Java: StringBuilder/StringBuffer中的reverse()方法可以正确运行。但是String中的length()、charAt()等在字符需要超过16位进行编码时就不行了。
C#: 没有找到正确的reverse方法,Length和索引访问返回错误的结果。
Perl: 同样的问题。
PHP: 完全没有Unicode概念,mbstring有一些更好的替代品。
我想知道是否有一种编程语言具有完整和正确的Unicode支持? 为了实现这个目标,需要做出什么妥协?
- 更复杂的算法?
- 更高的内存消耗?
- 更慢的性能?
它是如何在内部实现的?
- 整数数组、链表等。
- 额外的缓冲区
我看到Python 3在这方面有一些相当大的改变。现在Python 3离正确实现还有多远?