Python以退出代码-1073741819终止进程。

3

我正在尝试将一个大小为约190MB的csv文件读入pandas dataframe,但是出现了以下错误。我正在使用JetBrains的Pycharm IDE。

Process finished with exit code -1073741819 (0xC0000005)

我尝试运行的代码如下:

from pandas import DataFrame as df


if __name__ == '__main__':
    frame = df()
    frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)
    ab = list(frame.columns.values)
    print(ab)

这是来自CSV的一个实例:
createdat   text    coordinates entities    id_str  in_reply_to_user_id_str
Tue Feb 10 18:56:42 +0000 2015  

"RT @RubieDubes: official list of deluded XXXXX: 
Spurs Fans
Kanye West 
Louis van Gaal"     

{'trends': [], 'urls': [], 'user_mentions': [{'id': 65174814, 'name': 'Ruby ?', 'screen_name': 'RubieDubes', 'indices': [3, 14], 'id_str': '65174814'}], 'symbols': [], 'hashtags': []} 

5.65223E+17 

编辑:我尝试在Python控制台中运行它,结果出现错误:python.exe [11640]发生了未处理的win32异常。


你希望如何读取CSV文件?(结果数据框应该是什么样子的?)你提供的示例CSV文件似乎是一个非常不结构化的文件。 - joris
我从Excel中获取了样本,但我希望数据框的列是“创建于”、“文本”、“坐标”和“实体”。 - Nitin Kashyap
嗨,我已经在另一个CSV上尝试了它,运行良好,但是对于某些这种类型的CSV仍然无法正常工作。请帮忙。 - Nitin Kashyap
1个回答

3
我找出了问题所在。CSV文件中存在像这样的值,解析器无法正确读取。我修改了代码:
frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)

to

data = pandas.read_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', encoding='latin-1', engine='python')

看来utf-8编码引起了问题。当我改为“latin-1”时,代码运行正常。感谢您的帮助。

编辑:我发现这是由于数据中存在表情符号引起的。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接