我是Python的新手,正在尝试用Python处理Excel文件时遇到了麻烦。
我的情况是这样的:我使用requests从Web服务器获取一个.xls文件。然后我使用xlrd将内容保存在Excel文件中。我只对该文件的一个值感兴趣,并且我正在从不同的URL地址检索数千个文件。
我想知道如何以其他方式处理从请求中获取的内容,而不是创建一个新文件。
此外,我已经在代码中包含了我的注释,说明我如何改进它。除此之外,它并不起作用,因为我试图将新内容保存在已经创建的Excel文件中(但是我无法弄清楚如何删除该文件的内容,以使我的代码能够工作(即使它不是很有效率))。
import requests
import xlrd
d={}
for year in string_of_years:
for month in string_of_months:
dls=" http://.../name_year_month.xls"
resp = requests.get(dls)
output = open('temp.xls', 'wb')
output.write(resp.content)
output.close()
workbook = xlrd.open_workbook('temp.xls')
worksheet = workbook.sheet_by_name(mysheet_name)
num_rows = worksheet.nrows
for k in range(num_rows):
if condition I'm looking for:
w={key_year_month:worksheet.cell_value(k,0)}
dic.update(w)
break
pd.read_excel(xlrd.open_workbook(file_contents=resp.content), engine='xlrd')
也可以直接将其转换为 pandas DataFrame。 - hugovdberg