我想使用Excel文件来存储用Python处理的数据。我的问题是,我无法向现有的Excel文件中添加工作表。在这里,我提供了一段示例代码,以便解决此问题。
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)
x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.save()
writer.close()
这段代码将两个DataFrame保存到两个不同的工作表中,分别命名为“x1”和“x2”。如果我创建了两个新的DataFrame并尝试使用相同的代码添加两个新工作表“x3”和“x4”,那么原始数据将会丢失。
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)
x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.save()
writer.close()
我希望得到一个包含四个工作表的Excel文件:'x1'、'x2'、'x3'和'x4'。
我知道 'xlsxwriter' 不是唯一的“引擎”,还有 'openpyxl'。我也看到已经有其他人写过这个问题,但我仍然不明白该怎么做。
这里有一个来自这个链接的代码示例:
import pandas
from openpyxl import load_workbook
book = load_workbook('Masterfile.xlsx')
writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl')
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2'])
writer.save()
他们说它有效,但很难弄清楚如何操作。我不理解这个文本中的“ws.title”、“ws”和“dict”是什么意思。
最好的方法是保存“x1”和“x2”,然后关闭文件,再次打开并添加“x3”和“x4”?
writer.book = book
之后添加以下代码行:writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
- Harm