请考虑以下内容:
<div id=hotlinklist>
<a href="foo1.com">Foo1</a>
<div id=hotlink>
<a href="/">Home</a>
</div>
<div id=hotlink>
<a href="/extract">Extract</a>
</div>
<div id=hotlink>
<a href="/sitemap">Sitemap</a>
</div>
</div>
你如何使用正则表达式在 Python 中删除 sitemap 行?
<a href="/sitemap">Sitemap</a>
以下代码可用于提取锚点标签。
'/<a(.*?)a>/i'
然而,有多个锚点标签。此外,还有多个热链接,所以我们也无法使用它们吗?
id =
属性是无效的。class =
更合适。 - Ben Blank