我是一个有用的助手,可以翻译文本。
同样地,当我尝试使用
如何将此类字符串解码为Unicode。
我有一个字符串,比如说s = 'Chocolate Moelleux-M\xe8re'
当我执行:
In [14]: unicode(s)
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
同样地,当我尝试使用
s.decode()
进行解码时,它返回相同的错误。In [13]: s.decode()
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
如何将此类字符串解码为Unicode。
Chocolate Moelleux-Mère
转换为Chocolate Moelleux-Mre
。我不理解这怎么可能是实际的解决方案。另外,假设你遇到一个编码为ISO-8859-5的Мойст Шоколад Матери
版本。如果你忽略所有非ASCII字符解码,剩下的只有两个空格。换句话说,请通过指定匹配的编码来解码字符串。在你的例子中,使用unicode(s, 'latin-1')
来解码。 - Bernd Petersohn