我正在使用aiohttp从网站下载数据,但是我得到的响应是一个字节对象,我很难对其进行解码。
以下是我收到的响应示例。
我应该为每个标签手动执行
b'\\r\\nLocalit\xc3\xa0' # Località
b'\\u003cdiv\\u003e12/09/2019\\u003c/div\\u003e\\r\\n' # <div>12/09/2019</div>
据我所知,文本使用正常的Unicode编码,HTML标签和换行符则使用转义的Unicode编码。如果我尝试使用"str(content, "utf-8")"解码,仍然会保留这种格式的HTML标签。
\u003cdiv \u003e12/09/2019\u003c/div\u003e\r\n
我应该为每个标签手动执行
.replace("\u003", "<")
,还是有更优雅的解决方案?
unicode-escape
,我得到的是LocalitÃ
而不是Località
。 - Nicola