Pandas: UnicodeDecodeError: 'utf-8'编解码器无法解码第0-1个字节:无效的续字符字节。

8

社区。我想使用pandas打开CSV文件并对其进行分析。请帮忙,因为我无法打开CSV本身。我尝试使用UTF-8、Latin-1和ISO-8859-1编码打开它,但都没有成功。

:
csv_file3='COVID-19-geographic-disbtribution-worldwide.csv'
with open(csv_file3,'rt')as f:
    data = csv.reader(f)
    j=0
    for row in data:
         j+=1

错误:

Traceback (most recent call last):
  File "analysisofcases.py", line 87, in <module>
    for row in data:
  File "/usr/lib/python3.6/codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 15-16: invalid continuation byte

这是我想要打开的CSV文件。 这是我的代码和运行代码时出现的错误。请检查并查看问题所在。

1个回答

35

试一下,检查一下标准编码也是很好的选择。

data = pd.read_csv("COVID-19-geographic-disbtribution-worldwide.csv", encoding = 'unicode_escape', engine ='python')

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接