我有一个需要读取、解析等操作的html文件,它是unicode编码(我在记事本中看到了),但当我尝试
infile = open("path", "r")
infile.read()
它失败了,我遇到了著名的错误:
UnicodeEncodeError: 'charmap'编解码器无法对位置xx的字符进行编码:该字符映射到未定义
所以为了测试,我尝试将文件内容复制粘贴到一个新文件中,并以utf-8格式保存,然后像这样使用codecs打开它:
inFile = codecs.open("path", "r", encoding="utf-8")
outputStream = inFile.read()
但是我收到了这个错误信息:
UnicodeEncodeError:'charmap'编解码器无法将字符u'\ufeff'编码在位置0:字符映射到未定义
我真的不明白,因为我使用utf8创建了这个文件。
encoding='utf-16'
。 - EdChum