我有一个25GB的文本文件。所以我将它压缩成tar.gz格式,大小变为450MB。现在我想从Python中读取该文件并处理文本数据。我参考了 这个问题。但是在我的情况下,代码无法工作。代码如下:
import tarfile
import numpy as np
tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
f=tar.extractfile(member)
content = f.read()
Data = np.loadtxt(content)
错误如下:
Traceback (most recent call last):
File "dataExtPlot.py", line 21, in <module>
content = f.read()
AttributeError: 'NoneType' object has no attribute 'read'
还有其他方法可以完成这个任务吗?