用Python从字典创建HTML表格

8

我很新手地开始学习Python,因此想要创建一个基于文件名的HTML表格。 以下是需要处理的文件:

apple.good.2.svg
apple.good.1.svg
banana.1.ugly.svg
banana.bad.2.svg
kiwi.good.svg

对象种类总是在第一个点之前,质量属性则在名称的某个位置。

我的结果表应该如下所示:

Object Name    |       good       |       bad       |       ugly
-------------------------------------------------------------------------
apple          | apple.good.1.svg |
               | apple.good.2.svg |
-------------------------------------------------------------------------
banana         |                  | banana.bad.2.svg | banana.1.ugly.svg
-------------------------------------------------------------------------
kiwi           | kiwi.good.svg
-------------------------------------------------------------------------

这是我迄今为止所做的内容。
#!/usr/bin/python
import glob
from collections import defaultdict

fileNames = defaultdict(list)

# fill sorted list of tables based on svg filenames
svgFiles = sorted(glob.glob('*.svg'))
for s in svgFiles: 
    fileNames[s.split('.', 1)[0]].append(s)        

# write to html
html = '<html><table border="1"><tr><th>A</th><th>' + '</th><th>'.join(dict(fileNames).keys()) + '</th></tr>'

for row in zip(*dict(fileNames).values()):
    html += '<tr><td>Object Name</td><td>' + '</td><td>'.join(row) + '</td></tr>'

html += '</table></html>'

file_ = open('result.html', 'w')
file_.write(html)
file_.close()

我成功地将文件按字典顺序读取:

{'kiwi': ['kiwi.good.svg'], 'apple': ['apple.good.2.svg', 'apple.good.1.svg'], 'banana': ['banana.1.ugly.svg', 'banana.bad.2.svg']}

但是在生成HTML表格时失败了。

enter image description here

我该如何构建如上所示的HTML表格?其中对象写入行的第一列,文件名根据其质量属性写入列中。

1个回答

8

您需要遍历字典和状态中的所有水果组合,然后为每种水果创建一行(而不是一列)。然后只需遍历与该水果匹配的所有文件,并过滤包含当前状态的文件,将它们连接在一个单元格中。

d = {'kiwi': ['kiwi.good.svg'], 'apple': ['apple.good.2.svg', 'apple.good.1.svg'], 'banana': ['banana.1.ugly.svg', 'banana.bad.2.svg']}

html = """<html><table border="1">
<tr><th>Object</th><th>Good</th><th>Bad</th><th>Ugly</th></tr>"""
for fruit in d:
    html += "<tr><td>{}</td>".format(fruit)
    for state in "good", "bad", "ugly":
        html += "<td>{}</td>".format('<br>'.join(f for f in d[fruit] if ".{}.".format(state) in f))
    html += "</tr>"
html += "</table></html>"

结果:

enter image description here


更新:如果你有包含在其他状态中的状态表达式,例如badmedium_bad,那么仅使用in是行不通的。相反,你可以使用正则表达式来获取最佳匹配。
>>> fruit = "banana_bad.svg", "banana_medium_bad.svg"
>>> [re.search(r"[._](good|bad|medium_bad|ugly)[._]", f).group(1) for f in fruit]
['bad', 'medium_bad']

您可以使用以下代码:

然后您可以使用以下代码:

d = {'kiwi': ['kiwi.good.svg', 'kiwi_medium_bad.svg'], 'apple': ['apple.good.2.svg', 'apple.good.1.svg'], 'banana': ['banana.1.ugly.svg', 'banana.bad.2.svg']}
states = ['good', 'bad', 'medium_bad', 'ugly']

html = """<html><table border="1">
<tr><th>Object</th><th>{}</th></tr>""".format("</th><th>".join(states))
for fruit in d:
    html += "<tr><td>{}</td>".format(fruit)
    by_state = {f: re.search(r"[._]({})[._]".format('|'.join(states)), f).group(1) for f in d[fruit]}
    for state in states:
        html += "<td>{}</td>".format('<br>'.join(f for f in d[fruit] if by_state[f] == state))
    html += "</tr>"
html += "</table></html>"

或者,你也可以重新构造字典,增加另一层“状态”,例如:{"kiwi": {"good": ["kiwi.goog.svg"]}, ...}


如果你想在图像标签中包含文件名,你可以在join中再嵌套一个format

html += "<td>{}</td>".format('<br>'.join('<img src="{}">'.format(f) for f in d[fruit] if by_state[f] == state))

还有一个问题,假设我需要使用“”和“.”作为分隔符“{}。”,并且我的文件名中包含“*_bad.svg”和“*_medium_bad.svg”。由于“medium_bad.svg”被下划线分隔,它将进入错误的列。有没有办法解决这个问题? - Anatol
我只是想在使用字典将 medium_bad 替换为 medium-bad 之前,也许它会起作用吗? - Anatol
@tBook 不太确定你的意思。你是否有类别,例如“糟糕”和“中等糟糕”,问题是文件被归类为“糟糕”时实际上应该是“中等糟糕”? - tobias_k
确实,这就是问题所在。:( 我之前没有考虑到这种情况。抱歉。 - Anatol
tobias_k 最后一件事,我真的欠你一杯啤酒 ;) 如果我想将文件名集成到图像标签中,例如 <img src='kiwi.goog.svg'>,我应该在哪里做这个?抱歉,如我所述,我刚开始学习 Python,也许这是一个太难的事情。 - Anatol
tobias_k,你能再帮我一次吗?我需要处理那些文件名中没有州名称的文件。它们应该放在一个名为“其他”的列中。我尝试更改 by_state =,但不幸的是没有成功。 - Anatol

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接