已经有不少帮助了,但我仍然感到困惑。
我有一个像这样的 Unicode 字符串:
title = u'test'
title_length = len(title) #5
但是!我需要标题长度为6。客户希望它是6,因为他们似乎在后端计算方式不同。
为了解决这个问题,我编写了这个小助手,但我确定它可以改进(拥有足够的编码知识),或者甚至是错误的。
title_length = len(title) + repr(title).count('\\U') #6
1. 有没有更好的方法让长度变为6?:-)
我假设 Python 正在计算 Unicode 字符的数量,这个数量是5。而客户端正在计算字节数?
2. 如果有需要4个字节的其他 Unicode 字符,我的逻辑会出问题吗?
运行 Python 2.7 ucs4。