我有一个非常简单的csv文件,其中包含以下数据,它被压缩在tar.gz文件内。我需要使用pandas.read_csv将其读入到数据框中。
A B
0 1 4
1 2 5
2 3 6
import pandas as pd
pd.read_csv("sample.tar.gz",compression='gzip')
然而,我遇到了以下错误:
CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2
以下是read_csv命令的一组以及它们所产生的不同错误:
pd.read_csv("sample.tar.gz",compression='gzip', engine='python')
Error: line contains NULL byte
pd.read_csv("sample.tar.gz",compression='gzip', header=0)
CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2
pd.read_csv("sample.tar.gz",compression='gzip', header=0, sep=" ")
CParserError: Error tokenizing data. C error: Expected 2 fields in line 94, saw 14
pd.read_csv("sample.tar.gz",compression='gzip', header=0, sep=" ", engine='python')
Error: line contains NULL byte
这里出了什么问题?我该如何解决?
.gz
”文件与“.tar.gz
”文件不同。 - Nehal J Wanitar
压缩呢?为什么不直接使用gzip
压缩呢?这样你就可以直接使用 pd.read_csv() 读取它了。 - Nehal J Waniread_csv
,而不是尝试让pandas进行解压缩。 - BrenBarn