如何将HTML表格数据导出为CSV文件?

54

我在一个网站的HTML表格中有一些数据,需要知道如何将这些数据导出为CSV文件。

如何实现这个功能?


有多少数据?这是一次性的工作还是需要多次运行? - Ash Burlaczenko
很肯定你需要解析页面并从数据手动生成 CSV。 - Jim
可能可以查看 http://stackoverflow.com/questions/2627162/how-to-convert-html-to-csv - Paul D. Waite
请查看以下链接,下载JQuery实用工具,它可以将任何HTML表格导出为CSV文件。在报告项目开发期间使用此工具非常方便。当您的表格附有第三方jQuery表格搜索插件时,它也非常有用。http://www.kunalbabre.com/projects/table2CSV.php - Angshuman Bhattacharjee
8个回答

28

如果要将HTML导出为CSV,请按照以下示例操作。更多详细信息和示例可在作者网站上找到。

创建一个html2csv.js文件,并将以下代码放入其中。

jQuery.fn.table2CSV = function(options) {
    var options = jQuery.extend({
        separator: ',',
        header: [],
        delivery: 'popup' // popup, value
    },
    options);

    var csvData = [];
    var headerArr = [];
    var el = this;

    //header
    var numCols = options.header.length;
    var tmpRow = []; // construct header avalible array

    if (numCols > 0) {
        for (var i = 0; i < numCols; i++) {
            tmpRow[tmpRow.length] = formatData(options.header[i]);
        }
    } else {
        $(el).filter(':visible').find('th').each(function() {
            if ($(this).css('display') != 'none') tmpRow[tmpRow.length] = formatData($(this).html());
        });
    }

    row2CSV(tmpRow);

    // actual data
    $(el).find('tr').each(function() {
        var tmpRow = [];
        $(this).filter(':visible').find('td').each(function() {
            if ($(this).css('display') != 'none') tmpRow[tmpRow.length] = formatData($(this).html());
        });
        row2CSV(tmpRow);
    });
    if (options.delivery == 'popup') {
        var mydata = csvData.join('\n');
        return popup(mydata);
    } else {
        var mydata = csvData.join('\n');
        return mydata;
    }

    function row2CSV(tmpRow) {
        var tmp = tmpRow.join('') // to remove any blank rows
        // alert(tmp);
        if (tmpRow.length > 0 && tmp != '') {
            var mystr = tmpRow.join(options.separator);
            csvData[csvData.length] = mystr;
        }
    }
    function formatData(input) {
        // replace " with “
        var regexp = new RegExp(/["]/g);
        var output = input.replace(regexp, "“");
        //HTML
        var regexp = new RegExp(/\<[^\<]+\>/g);
        var output = output.replace(regexp, "");
        if (output == "") return '';
        return '"' + output + '"';
    }
    function popup(data) {
        var generator = window.open('', 'csv', 'height=400,width=600');
        generator.document.write('<html><head><title>CSV</title>');
        generator.document.write('</head><body >');
        generator.document.write('<textArea cols=70 rows=15 wrap="off" >');
        generator.document.write(data);
        generator.document.write('</textArea>');
        generator.document.write('</body></html>');
        generator.document.close();
        return true;
    }
};

将js文件包含在HTML页面中,可以像这样进行:

将js文件包含在HTML页面中,可以像这样进行:

<script type="text/javascript" src="jquery-1.3.2.js" ></script>

<script type="text/javascript" src="html2CSV.js" ></script>

表格:

<table id="example1" border="1"  style="background-color:#FFFFCC" width="0%" cellpadding="3" cellspacing="3">

    <tr>

        <th>Title</th>

        <th>Name</th>

        <th>Phone</th>

    </tr>

    <tr>

        <td>Mr.</td>

        <td>John</td>

        <td>07868785831</td>

    </tr>

    <tr>

        <td>Miss</td>

        <td><i>Linda</i></td>

        <td>0141-2244-5566</td>

    </tr>

    <tr>

        <td>Master</td>

        <td>Jack</td>

        <td>0142-1212-1234</td>

    </tr>

    <tr>

        <td>Mr.</td>

        <td>Bush</td>

        <td>911-911-911</td>

    </tr>

</table>

导出按钮:

<input value="Export as CSV 2" type="button" onclick="$('#example1').table2CSV({header:['prefix','Employee Name','Contact']})">

你好,非常感谢您迅速而详细的回复。我尝试了您的代码,但是在javascript中似乎出现了许多错误。由于我不是Javascript专家,所以不知道该如何修复它。 - forrest
谢谢。但是你能否提到错误所在?并且告诉我你是否先尝试了上面的例子? - talha2k
1
这对我很有效。我正在使用jQuery 1.7.2。非常感谢! - michaelok
这里没有爱 - jQuery 1.7.3,按下那个按钮什么也没发生 :( - itsricky
谢谢你的回答。如果我的表格有分页,我想下载整个表格而不是当前可见的行,该怎么办?谢谢! - typeof programmer

26

我能够使用这里概述的答案:使用jQuery和html导出CSV,并添加了一个修改使其在IE中工作以及评论中提到的另一个修改来获取表格的thead。

function exportTableToCSV($table, filename) {

    var $rows = $table.find('tr:has(td),tr:has(th)'),

        // Temporary delimiter characters unlikely to be typed by keyboard
        // This is to avoid accidentally splitting the actual contents
        tmpColDelim = String.fromCharCode(11), // vertical tab character
        tmpRowDelim = String.fromCharCode(0), // null character

        // actual delimiter characters for CSV format
        colDelim = '","',
        rowDelim = '"\r\n"',

        // Grab text from table into CSV formatted string
        csv = '"' + $rows.map(function (i, row) {
            var $row = $(row), $cols = $row.find('td,th');

            return $cols.map(function (j, col) {
                var $col = $(col), text = $col.text();

                return text.replace(/"/g, '""'); // escape double quotes

            }).get().join(tmpColDelim);

        }).get().join(tmpRowDelim)
            .split(tmpRowDelim).join(rowDelim)
            .split(tmpColDelim).join(colDelim) + '"',



        // Data URI
        csvData = 'data:application/csv;charset=utf-8,' + encodeURIComponent(csv);

        console.log(csv);

        if (window.navigator.msSaveBlob) { // IE 10+
            //alert('IE' + csv);
            window.navigator.msSaveOrOpenBlob(new Blob([csv], {type: "text/plain;charset=utf-8;"}), "csvname.csv")
        } 
        else {
            $(this).attr({ 'download': filename, 'href': csvData, 'target': '_blank' }); 
        }
}

// This must be a hyperlink
$("#xx").on('click', function (event) {

    exportTableToCSV.apply(this, [$('#projectSpreadsheet'), 'export.csv']);

    // IF CSV, don't do event.preventDefault() or return false
    // We actually need this to be a typical hyperlink
});

我的链接长这样...

<a href="#" id="xx" style="text-decoration:none;color:#000;background-color:#ddd;border:1px solid #ccc;padding:8px;">Export Table data into Excel</a>

JsFiddle: https://jsfiddle.net/mnsinger/65hqxygo/


非常好的回答。感谢分享。这正是我想要的! - Rymnel
正是我所需要的!谢谢。 - Simon Franzen
非常好的回答,谢谢!在使用Excel打开CSV文件时,有没有一种指定列宽的方法? - payne

4
以下解决方案可以实现它。

$(function() {
  $("button").on('click', function() {
    var data = "";
    var tableData = [];
    var rows = $("table tr");
    rows.each(function(index, row) {
      var rowData = [];
      $(row).find("th, td").each(function(index, column) {
        rowData.push(column.innerText);
      });
      tableData.push(rowData.join(","));
    });
    data += tableData.join("\n");
    $(document.body).append('<a id="download-link" download="data.csv" href=' + URL.createObjectURL(new Blob([data], {
      type: "text/csv"
    })) + '/>');


    $('#download-link')[0].click();
    $('#download-link').remove();
  });
});
table {
  border-collapse: collapse;
}

td,
th {
  border: 1px solid #aaa;
  padding: 0.5rem;
  text-align: left;
}

td {
  font-size: 0.875rem;
}

.btn-group {
  padding: 1rem 0;
}

button {
  background-color: #fff;
  border: 1px solid #000;
  margin-top: 0.5rem;
  border-radius: 3px;
  padding: 0.5rem 1rem;
  font-size: 1rem;
}

button:hover {
  cursor: pointer;
  background-color: #000;
  color: #fff;
}
<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>

<table>
  <thead>
    <tr>
      <th>Name</th>
      <th>Author</th>
      <th>Description</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>jQuery</td>
      <td>John Resig</td>
      <td>The Write Less, Do More, JavaScript Library.</td>
    </tr>
    <tr>
      <td>React</td>
      <td>Jordan Walke</td>
      <td>React makes it painless to create interactive UIs.</td>
    </tr>
    <tr>
      <td>Vue.js</td>
      <td>Yuxi You</td>
      <td>The Progressive JavaScript Framework.</td>
    </tr>
  </tbody>
</table>

<div class="btn-group">
  <button>csv</button>
</div>


2020年用不用jQuery? - Roel

3
这是一个非常快速的CoffeeScript/jQuery示例。
csv = []
for row in $('#sometable tr')
  csv.push ("\"#{col.innerText}\"" for col in $(row).find('td,th')).join(',')
output = csv.join("\n")

2
感谢 gene tsai,以下是他的代码修改后可以在我的目标页面上运行:
csv = []
rows = $('#data tr');
for(i =0;i < rows.length;i++) {
    cells = $(rows[i]).find('td,th');
    csv_row = [];
    for (j=0;j<cells.length;j++) {
        txt = cells[j].innerText;
        csv_row.push(txt.replace(",", "-"));
    }
    csv.push(csv_row.join(","));
}
output = csv.join("\n")

改进:

  • 使用通用的JavaScript for循环
  • 确保每个单元格没有逗号

1

你可以使用Chrome的扩展程序,在我尝试过几次后它的效果很好。

https://chrome.google.com/webstore/search/html%20table%20to%20csv?_category=extensions

当安装并在任何带有表格的网页上,如果您单击此扩展程序的图标,它将显示页面中的所有表格,并在您滚动列表时突出显示每个表格,单击可以将其复制到剪贴板或保存到Google文档。对于我需要偶尔将基于Web的表格数据转换为我可以使用的电子表格,它的工作非常完美。

0
我简要介绍了两种方法来实现这个目标,一种是使用 Google Spreadsheets (importHTML),另一种是使用 Python (Pandas 的 read_htmlto_csv)。此外,我在这里的 SO 回答中提供了一个示例 Python 脚本:https://dev59.com/XHVC5IYBdhLWcg3wixw0#28083469

0

如果只是偶尔需要,可以尝试使用一些 Firefox 插件来方便地将 HTML 表格数据复制到剪贴板中(例如 https://addons.mozilla.org/en-US/firefox/addon/dafizilla-table2clipboard/)。例如,对于“table2clipboard”插件:

  1. 在 Firefox 中安装该插件
  2. 在 Firefox 中打开包含表格的网页
  3. 在表格中任意位置右键单击,选择“复制整个表格”
  4. 启动电子表格应用程序,如 LibreOffice Calc
  5. 将内容粘贴到电子表格中(根据需要选择适当的分隔符)
  6. 将电子表格另存为 CSV 格式。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接