你好,我从库中接收到文本,在打印接收到的文本时,我看到一些非英文字符,如"\u00e7",实际上应该是 "ç"。我猜想需要对文本进行编码和解码,但我是 Python 的新手,不确定是否是正确的方法。请问你能指点一下吗?
你好,我从库中接收到文本,在打印接收到的文本时,我看到一些非英文字符,如"\u00e7",实际上应该是 "ç"。我猜想需要对文本进行编码和解码,但我是 Python 的新手,不确定是否是正确的方法。请问你能指点一下吗?
>>> s = r'\u00e7'
>>> print s
\u00e7
>>> print s.decode('unicode-escape')
ç
>>>
如果 sys.stdout.encoding
是 ascii
,那么使用 print
会引发 UnicodeEncodeError
错误;在这种情况下,需要显式地进行编码:
>>> print s.decode('unicode-escape').encode('utf-8')
ç
unicode-escape
处理的内容。 - user2357112UnicodeEncodeError:'ascii'编解码器无法对位置135中的字符u'\u0131'进行编码:超出范围(128)
- smart-dev.orgs.decode('unicode-escape').encode('utf-8')
。 - falsetru