我编写了一个小脚本,旨在查找页面中的特定字符串并返回包含该字符串的元素的xpath。其目的是使用此xpath查找具有相同上下文的字符串。
我正在使用以下代码:
import requests
from lxml import html
page = requests.get("http://www.w3schools.com/xpath/")
tree = html.fromstring(page.text)
result = tree.xpath('//*[. = "XML"]')
result[0]
返回 <Element b at 0x7f034a08e940>
我无法找到此元素的XPath。
我想要的字符串是:
/html/body/div[4]/div/div[2]/div[2]/div[1]/div/ul/li[2]