我正在尝试爬取以下网站:http://www.hudson211.org/zf/profile/service/id/659837。
我想要选择“网址”文本旁边的href。以下xpath选择器可以获取我想要的标签:
然而,当我尝试使用@href来提取href时,返回的值是一个空数组:
我想要选择“网址”文本旁边的href。以下xpath选择器可以获取我想要的标签:
$x("//th[contains(text(), 'Web Address')]/following-sibling::td/a")
返回值
<a href="http://www.co.sullivan.ny.us">www.co.sullivan.ny.us</a>
然而,当我尝试使用@href来提取href时,返回的值是一个空数组:
$x("//th[contains(text(), 'Web Address')]/following-sibling::td/a/@href")
返回 []
这是我正在查看的行的 HTML:
<tr valign="top">
<td class="profile_view_left"></td>
<th align="left" class="profile_view_center">Web Address</th>
<td class="profile_view_right">
<ahref="http://www.co.sullivan.ny.us">www.co.sullivan.ny.us</a> </td>
<td></td>
</tr>
<a href="/topic/19778287" name="topic">实体</a>
中提取href。然而使用//a[@name = "topic"]/@href
,控制台显示空列表。然后我使用了你的方法,发现它实际上返回了正确的列表。可能是Chrome的一个bug -_- - Skywalker326