Python的HTML解析器能否编辑/更改HTML元素的innerText或仅读取它?

3

我正在使用Python模块HTMLParser.py。

我能够正确解析HTML,但是是否有选项可以更改HTML元素的数据(innerText)?

你知道如何在HTMLParser模块中实现这一点吗?


1
如果你能的话,强烈推荐使用BeautifulSoup - jterrace
1个回答

0
不,HTMLParser只是解析你的HTML而已。
你可能在寻找Beautiful Soup。它会创建一个ParseTree——一个表示文档HTML元素的Pythonic对象树。然后,你可以搜索你想要的对象(元素),给它赋一个新值,就完成了!
无耻地从文档中窃取:
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup("<b>Argh!</b>")
soup.find(text="Argh!").replaceWith("Hooray!")
print soup
# <b>Hooray!</b>

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接