我正在尝试查看是否可以将urllib.request.urlopen()
的输出传输到文本文件中以查看。我尝试将输出解码为字符串,以便将其写入文件,但原始输出包含一些无法正确转换为字符串的韩文字。
from urllib.request import urlopen
openU = urlopen(myUrl)
pageH = openU.read()
openU.close()
stringU = pageH.decode("utf-8")
f=open("test.txt", "w+")
f.write(stringU)
在最后一步之前,我没有收到任何错误提示,但是在最后一步时,它显示:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Users\Chae\AppData\Local\Programs\Python\Python36\lib\encodings\cp1252.py", line 19, in encode
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode characters in position 85-89: character maps to `<undefined>`
有没有办法让字符串也包含韩文,如果不行,如何跳过导致问题的字符并将其余部分写入文件?
, encoding="utf-8"
帮了我大忙,我为了解决这个问题搜索了好几个小时! - Zac1