节省大型xlsx文件的存储空间 - 使用Python Pandas

3

我试图将20个Excel文件连接成一个并保存为Excel,应该在一个表格中。 我目前的想法是将所有文件读入数据帧中,将它们合并并保存到Excel中。在合并后,我得到了一个形状为(1245226, 20)的数据帧,保存到Excel后,大小为(1048576, 20),在磁盘上的大小为61 MB。下面是我尝试过的保存文件的方法:

>> df.shape
(1245226, 20)

方法1 - 获取(1048576, 20)而不是(1245226, 20)

writer = pd.ExcelWriter(path)
df.to_excel(writer, index=False)
writer.close()

方法二 - 由于内存不足(16 gb RAM),无法保存文件。
writer = pd.ExcelWriter(path, engine='openpyxl')
df.to_excel(writer, index=False)
writer.close()

方法三 - 得到了(1048576, 20)而不是(1245226, 20)。
writer = pd.ExcelWriter(path, enigne='xlsxwriter')
df.to_excel(writer, index=False)
writer.close()

有没有什么想法可以保存它?也许有一种方法可以直接将数据附加到Excel文件中?

https://dev59.com/sVIH5IYBdhLWcg3wXMy2#66743446 - iacob
1个回答

9

我明白了。谢谢您的快速回答。 - Kornel

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接