Python将CSV转换为XLSX

65

这篇文章中,有一个Python示例可以将CSV转换为XLS。

但是,我的文件超过了65536行,因此xls不起作用。如果我将文件命名为xlsx,也没有任何区别。是否有Python软件包可将其转换为xlsx?

8个回答

108

以下是使用xlsxwriter的示例:

import os
import glob
import csv
from xlsxwriter.workbook import Workbook


for csvfile in glob.glob(os.path.join('.', '*.csv')):
    workbook = Workbook(csvfile[:-4] + '.xlsx')
    worksheet = workbook.add_worksheet()
    with open(csvfile, 'rt', encoding='utf8') as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                worksheet.write(r, c, col)
    workbook.close()

值得一提的是,还有一个名为openpyxl的包,可以读写Excel 2007 xlsx/xlsm文件。


4
感谢这个非常有用的代码片段。在使用大文件时,最好使用“constant_memory”来控制内存使用,例如:workbook = Workbook(csvfile + '.xlsx', {'constant_memory': True})。参考链接:http://xlsxwriter.readthedocs.org/en/latest/working_with_memory.html - Ethan
2
不错...然而,创建的xlsx文件中,所有数字字段都有错误,因为这些字段被存储为文本而不是数字... - MrMobileMan
2
在这里找到了解决数字作为文本问题的方法:https://dev59.com/q4Hba4cB1Zd3GeqPXeZN - MrMobileMan
我不得不添加这些行以使其与西欧语言配合使用 导入sys 重新加载(sys) sys.setdefaultencoding('latin-1') - Diego
3
最好使用xlsxwriter构造选项strings_to_numbers。例如,workbook = Workbook('output.xlsx',{'strings_to_numbers':True})。 - pookie
显示剩余9条评论

45

使用我的库 pyexcel

 $ pip install pyexcel pyexcel-xlsx

您可以在一条命令行中完成:

from pyexcel.cookbook import merge_all_to_a_book
# import pyexcel.ext.xlsx # no longer required if you use pyexcel >= 0.2.2 
import glob


merge_all_to_a_book(glob.glob("your_csv_directory/*.csv"), "output.xlsx")
每个 csv 将有自己的工作表,并且名称将是它们的文件名。

1
非常好,谢谢!我点赞了这个。然而,我遇到的一个问题是,无论是这个还是xlswriter创建的xlsx都充满了错误,即文本字段被格式化为文本而不是数字... - MrMobileMan
1
在这里找到了解决数字作为文本问题的方法... https://dev59.com/q4Hba4cB1Zd3GeqPXeZN - MrMobileMan
如果需要额外的格式化,你可以使用 pyexcel.Sheet 而不是 merge_all_to_a_book。通过 format() 函数,你可以将浮点数转换为整数,并使用 sheet 操作 将它们合并并保存为 csv。 - chfw
1
使用pyexcel-cli包和pyexcel、pyexcel-xlsx,您可以在命令行中执行以下操作:$ pyexcel merge your_csv_directory/*.csv out.xlsx - chfw
1
来自2022年的感谢您。 - thethiny
显示剩余4条评论

29

使用pandas的简单两行代码解决方案

import pandas as pd

read_file = pd.read_csv('File name.csv')
read_file.to_excel('File name.xlsx', index=None, header=True)

2
这可能是更加高效的做法。 - Muneeb Ahmad Khurram
谢谢!我该如何将内容转储到UI而不是文件中? - Ricky Levi
给我一个错误。pandas.errors.ParserError: 解析数据时出错。C 错误:预期第33行有1个字段,但看到了2个。 - john k

26

首先安装openpyxl:

pip install openpyxl

那么:

from openpyxl import Workbook
import csv


wb = Workbook()
ws = wb.active
with open('test.csv', 'r') as f:
    for row in csv.reader(f):
        ws.append(row)
wb.save('name.xlsx')

易于使用并支持Unicode字符!对我来说最好和简单。 - Adarsh Raj

12

添加一个仅使用 pandas 库读取 .csv 文件并保存为 .xlsx 文件的答案示例。此示例使用 pandas.read_csv (链接到文档) 和 pandas.dataframe.to_excel (链接到文档)。

完全可复制的示例仅使用 numpy 生成随机数,如果您想使用自己的 .csv 文件,则可以删除该部分。

import pandas as pd
import numpy as np

# Creating a dataframe and saving as test.csv in current directory
df = pd.DataFrame(np.random.randn(100000, 3), columns=list('ABC'))
df.to_csv('test.csv', index = False)

# Reading in test.csv and saving as test.xlsx

df_new = pd.read_csv('test.csv')
writer = pd.ExcelWriter('test.xlsx')
df_new.to_excel(writer, index = False)
writer.save()

依赖于pandas内部的openpyxl。 - Darren Smith
注意:这取决于您的CSV文件是否为平面文件格式。 - S3DEV

6

简单的1对1的CSV转XLSX文件转换,无需枚举/循环行:

import pyexcel

sheet = pyexcel.get_sheet(file_name="myFile.csv", delimiter=",")
sheet.save_as("myFile.xlsx")

注:

  1. 我发现如果文件名太长(不包括路径,超过30个字符),那么生成的XLSX文件在Excel尝试加载时会抛出错误。 Excel将提供修复错误的选项,但这很令人沮丧。
  2. 之前提供了一个很好的答案,可以将目录中的所有CSV文件合并为一个XLSX工作簿,适用于与仅尝试进行一对一的CSV文件到XLSX文件转换不同的用例。

简单的做法 - Muneeb Ahmad Khurram
请注意,此解决方案需要使用 pyexcel 的名为 pyexcel-xlsx 的插件。 - Yuri

4

我使用openpyxl库来完成这项任务:

import csv
from openpyxl import Workbook

def convert_csv_to_xlsx(self):
    wb = Workbook()
    sheet = wb.active

    CSV_SEPARATOR = "#"

    with open("my_file.csv") as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                for idx, val in enumerate(col.split(CSV_SEPARATOR)):
                    cell = sheet.cell(row=r+1, column=idx+1)
                    cell.value = val

    wb.save("my_file.xlsx")

1

有一个简单的方法

import os
import csv
import sys

from openpyxl import Workbook

reload(sys)
sys.setdefaultencoding('utf8')

if __name__ == '__main__':
    workbook = Workbook()
    worksheet = workbook.active
    with open('input.csv', 'r') as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                for idx, val in enumerate(col.split(',')):
                    cell = worksheet.cell(row=r+1, column=c+1)
                    cell.value = val
    workbook.save('output.xlsx')

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接