我看过类似的问题,但是我看到的解决方案在以下情况下不起作用。我离XPath专家还很远。我只需要解析一些HTML。如何选择跟随Header 2的表格。我认为下面的解决方案应该可以工作,但显然没有。有人能帮我吗?
content = """<div>
<p><b>Header 1</b></p>
<p><b>Header 2</b><br></p>
<table>
<tr>
<td>Something</td>
</tr>
</table>
</div>
"""
from lxml import etree
tree = etree.HTML(content)
tree.xpath("//table/following::p/b[text()='Header 2']")