我从网页上获取到以下文本:
£6.49
显然,我希望它显示为:
£6.49
到目前为止,我尝试了以下方法:
s = url['title']
s = s.encode('utf8')
s = s.replace(u'Â','')
以下是一些变体(在同一个论坛上找到的):
但仍然没有运气,因为我不断收到以下错误信息:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 100: ordinal not in range(128)
有人能帮我解决这个问题吗?
更新:
添加repr示例和内容类型。
u'Star Trek XI £3.99'
u'Oscar Winners Best Pictures Box Set \xc2\xa36.49'
Content-Type: text/html; charset=utf-8
提前感谢您。
repr(...)
。那么我们就能确切地知道我们要处理什么。 - unutbu