我刚接触XPath。 我正在尝试使用XPath解析页面。 我需要从<title>标签中获取信息,但是标题中的撇号会使一切都出错。
我使用Grab进行解析。
源代码中的标签:
<img src='somelink' border='0' alt='commission:Alfred\'s misadventures' title='commission:Alfred\'s misadventures'>
实际 XPath:
g.xpath('.//tr/td/a[3]/img').get('title')
返回
commission:Alfred\\
有没有什么方法可以解决这个问题?
谢谢。
.xpath
返回了任何东西。这个HTML代码非常无效,以至于LXML的html
模块不能处理它。 - Fred Foo