将Python Pandas数据框保存为HTML页面

39

我正在尝试将定义在Python Pandas Data Frame中的内容保存为HTML页面。此外,我希望将此表保存为HTML表格,并具有按任何列值过滤的能力。请提供可能的解决方案。最终,这应该是一张保存为HTML页面的表格。我希望将此代码纳入我的Python代码中。谢谢

3个回答

60
你可以使用 pandas.DataFrame.to_html()

示例:

>>> import numpy as np
>>> from pandas import *
>>> df = DataFrame({'foo1' : np.random.randn(2),
                    'foo2' : np.random.randn(2)})
>>> df.to_html('filename.html')

这会将以下 HTML 保存到 filename.html 文件中。

输出:

<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>foo1</th>
      <th>foo2</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>0</th>
      <td>-0.223430</td>
      <td>-0.904465</td>
    </tr>
    <tr>
      <th>1</th>
      <td>0.317316</td>
      <td>1.321537</td>
    </tr>
  </tbody>
</table>


谢谢。如果我想将这个HTML网页保存在我的C盘上,我该如何提供路径?谢谢。 - Felix
3
为什么不直接使用 df.to_html('your_filename.html') 呢? - CT Zhu
1
@CTZhu,确实更优雅!+1。我以前没有使用过这种方法,所以不知道。让我更新我的答案。 - Sait
有什么想法可以同时保存样式 (CSS) 吗? - Dimitri
在将DF转换为to_html时,是否有一种方法可以为<tbody></tbody>标签插入一个id - Love Putin Not War

14

.to_html() 也可以用于创建 HTML 字符串。

import io
import pandas as pd
from numpy.random import randn

df = pd.DataFrame(
    randn(5, 4),
    index = 'A B C D E'.split(),
    columns = 'W X Y Z'.split()
)

str_io = io.StringIO()

df.to_html(buf=str_io, classes='table table-striped')

html_str = str_io.getvalue()

print(html_str)

<table border="1" class="dataframe table table-striped">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>W</th>
      <th>X</th>
      <th>Y</th>
      <th>Z</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>A</th>
      <td>0.302665</td>
      <td>1.693723</td>
      <td>-1.706086</td>
      <td>-1.159119</td>
    </tr>
    <tr>
      <th>B</th>
      <td>-0.134841</td>
      <td>0.390528</td>
      <td>0.166905</td>
      <td>0.184502</td>
    </tr>
    <tr>
      <th>C</th>
      <td>0.807706</td>
      <td>0.072960</td>
      <td>0.638787</td>
      <td>0.329646</td>
    </tr>
    <tr>
      <th>D</th>
      <td>-0.497104</td>
      <td>-0.754070</td>
      <td>-0.943406</td>
      <td>0.484752</td>
    </tr>
    <tr>
      <th>E</th>
      <td>-0.116773</td>
      <td>1.901755</td>
      <td>0.238127</td>
      <td>1.996652</td>
    </tr>
  </tbody>
</table>


3

以下是一种不使用to_html的方式来编写pandas表格,同时包括外部样式表:

html_string_start = '''
<html>
  <head><title>Report Title</title></head>
  <link rel="stylesheet" type="text/css" href="mystyle.css"/>
  <body>
'''
html_string_end = '''
  </body>
</html>
'''

with open(r'c:\temp\myfile.html', 'w') as f:
    f.write(html_string_start)
    f.write('<table>')
    for header in dataframe.columns.values:
        f.write('<th>'+str(header)+'</th>')
    for i in range(len(dataframe)):
        f.write('<tr>')
        for col in dataframe.columns:
            value = dataframe.iloc[i][col]    
            f.write('<td>'+str(value)+'</td>')
        f.write('</tr>')
    f.write('</table>')
    f.write(html_string_end)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接