如何使用pandas和glob将多个.xlsx文件转换为.csv?

3

我有一个文件夹JanuaryDataSentToResourcePro,其中包含多个 .xlsx 文件。 我想遍历整个文件夹,并将所有文件转换为 .csv 格式并保留相同的文件名。

为此,我尝试使用 glob,但是出现了错误:TypeError:'module' object is not callable

import glob
excel_files = glob('*xlsx*')

for excel in excel_files:
    out = excel.split('.')[0]+'.csv'
    df = pd.read_excel(r'''C:\Users\username\Documents\TestFolder\JanuaryDataSentToResourcePro\ResourceProDailyDataset_01_01_2018.xlsx''', 'ResourceProDailyDataset')
    df.to_csv(out) 

我刚接触Python,这看起来对吗?

更新:

import pandas as pd
import glob
excel_files = glob.glob("*.xlsx")

for excel in excel_files:
    out = excel.split('.')[0]+'.csv'
    df = pd.read_excel(excel, 'ResourceProDailyDataset')
    df.to_csv(out)

但仍无法将 .xlsx 转换为 .csv

1个回答

12

应该像这样使用 glob 包:

import glob
f = glob.glob("*.xlsx")

glob不是一个方法,但是glob.glob是。

========================================

import glob
excel_files = glob.glob('C:/Users/username/Documents/TestFolder/JanuaryDataSentToResourcePro/*.xlsx') # assume the path
for excel in excel_files:
    out = excel.split('.')[0]+'.csv'
    df = pd.read_excel(excel) # if only the first sheet is needed.
    df.to_csv(out) 

但是它将如何知道要去哪个文件夹? - Serdia
我为你添加了解决方案,请投票确认是否可以。 - AC at CA
明白了。抱歉让你困惑了!感谢你的帮助,Alex! - Serdia
你怎么会是一名高级数据分析师,而且只在这个网站上注册了23天呢? :) - Serdia
我只是阅读帖子,从未发问或贡献过,直到我的朋友说我应该这样做。哈哈 - AC at CA
显示剩余5条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接