我的逗号分隔的文本文件包含以下格式的数据(当然,还有更多列和行)。
1977,PA,2017-08-07,55,New Firms,327.0
1978,NY,2017-08-07,45,New Firms,$30,127
1978,NY,2017-08-07,$10,000,New Firms,1,000
正如您所看到的,有些数据包含千位分隔符,我这样读取:
df=pd.read_csv("data.txt", thousands=r',')
df.head()
这会出现一个错误消息
ParserError: Error tokenizing data. C error: Expected 13 fields in line 102996, saw 14
我认为错误发生的原因是某些数据包含了千位分隔符。有什么建议吗?
.split(", ")
。 - fractals