我试图获取字符串中选定单词的范围。当处理 İ
字符时,我注意到Python
的下列行为:
len("İ")
Out[39]: 1
len("İ".lower())
Out[40]: 2
# when `upper()` is applied, the length stays the same
len("İ".lower().upper())
Out[41]: 2
为什么大小写相同的字符的长度不同(这似乎非常令人困惑/不期望)?
有人知道是否还有其他字符也会出现这种情况吗? 谢谢!
编辑:
另一方面,例如Î,长度保持不变:
len('Î')
Out[42]: 1
len('Î'.lower())
Out[43]: 1