我正在尝试从一个网页中收集信息,但无法获取正确的XPath来查找它。以下是来自网站的一段内容:
<div class="posted">
<div>
June 20, 2018
</div>
</div>
我想搜索每个页面,查找带有“posted”类的元素,然后将其下方的所有内容作为字符串返回。(字符串可以有杂乱无章的格式;我将使用“if "2018" in "possibleDate"”来搜索年份)这是我的尝试代码:
possibleDate = str(tree.xpath("//div[contains(@class, ’posted’)]//@text"))
它说这是一个无效的表达式。
我哪里做错了吗?
[contains(@class, 'posted')]
不是错误的,但我怀疑你想要的是[@class = 'posted']
。 "contains" 版本将匹配@class="signposted"
;而 "=" 版本则不会。 - Michael Kay