在我的Python世界中,我很高兴知道当我需要向用户输出内容时,把所有内容都编码成Unicode并编码为UTF-8。然后,我的一个同事发送给我一篇文章“The UTF-8 Everywhere' manifesto”(2012年),它让我感到困惑。
- 文章的作者多次声称UCS-2 Unicode表示法与Python使用的UTF-16是相同的。
- 他甚至直接说Python在内部字符串表示上使用UTF-16。
- 这位作者也承认自己是个Windows爱好者和开发人员,他指出微软多年来处理字符编码的方式导致该群体最困惑,也许只是他自己感到困惑。 我不知道...
请问有人能解释Python中UTF-16和Unicode的状态吗? 它们是否相同,如果不是,请说明差异在哪里?