我有一个大的json文件,它是日志数据,并已经被压缩成bz2格式(myfile.json.bz2)。bz2文件大小为90MB。我搜索了好多方法,想找到一个能有效解析压缩的bz2 json文件的好方法或博客文章,但是没有找到。由于文件太大,做像这样的事情是不可能的。
with open('data.json') as data_file:
data = json.load(data_file)
什么是最佳方法?
经过一些研究,我发现有一个Python包可以读取bz2文件。
input_file = bz2.BZ2File(filename, 'r')
BZ2File
具有返回任意字节数的read
方法,因此我可能会考虑尝试将json作为流读取,使用类似https://pypi.python.org/pypi/ijson/的东西。 - njzk2