我一直在试图使用Pandas中的read_csv
函数来读取几个大型文本文件(大小约为1.4GB-2GB),但一直没有成功。以下是我所使用的版本:
- Python 2.7.6
- Anaconda 1.9.2 (64位) (默认值,2013年11月11日,10:49:15) [MSC v.1500 64 bit (AMD64)]
- IPython 1.1.0
- Pandas 0.13.1
我尝试了以下方法:
df = pd.read_csv(data.txt')
当时出现了一个错误,Ipython 弹出消息: Kernel died, restarting
。
后来我尝试使用迭代器:
tp = pd.read_csv('data.txt', iterator = True, chunksize=1000)
我又遇到了Kernel died, restarting
错误。
有什么想法吗?或者有其他读取大文本文件的方法吗?
谢谢!
pd.read_csv()
读取一个2.9GB的csv文件时,Python需要大约5GB的峰值内存。 - Saullo G. P. Castro