PHP中有多字节字符串函数来处理多字节字符串(例如:CJK脚本)。例如,我想通过使用Python的len
函数来计算多字节字符串中有多少个字符,但它返回了一个不准确的结果(即这个字符串中的字节数)。
japanese = "桜の花びらたち"
print japanese
print len(japanese)#return 21 instead of 7
有没有类似于PHP中mb_strlen的包或函数?
PHP中有多字节字符串函数来处理多字节字符串(例如:CJK脚本)。例如,我想通过使用Python的len
函数来计算多字节字符串中有多少个字符,但它返回了一个不准确的结果(即这个字符串中的字节数)。
japanese = "桜の花びらたち"
print japanese
print len(japanese)#return 21 instead of 7
# Encoding: UTF-8
japanese = u"桜の花びらたち"
print japanese
print len(japanese)
u
。decode
: "桜の花びらたち".decode('utf-8')
。尝试先将其转换为 unicode
:
print len(japanese.decode("utf-8"))
得到7。您正在处理utf-8编码的字符串,该字符串实际上有21个字节。