我有大约700个Excel文件,需要通过删除一些标题并更改一些列名来将其转换为CSV文件。我已经实现了解决方案,但是速度很慢。我发现读取Excel到数据框架中需要很多时间,我使用的是如下所示的Pandas:
df = pd.read_excel(file_path, skiprows=self.skip_rows)
我猜有一些Unix命令可以快速执行此操作,但我想要一个Python的解决方案。是否有其他更快的库?此外,我想知道为什么读取Excel文件需要更长时间,如果我们想要保留来自Excel的样式和颜色,那么这应该需要更长时间。但在我的情况下,我只需要将其读入数据帧中。
以下是版本号:
- Python: 2.7.12 - Pandas: 0.21.0 - Xlrd: 1.0.0
dtype=object
,通常可以看到一些速度提升,它不会对数据做出任何假设,应该更快。 - cs95