我正在尝试爬取一个复杂的HTML页面。我需要获取某些特定类别的div中的文本内容。
我的目标是使用HTML Agility Pack遍历整个HTML页面,找出所有类包含“listevent”的div,并将其返回给我。
当我在网上搜索时,发现如果进行映射,这是可能的,但其中一些div位于许多其他div的下面,因此寻找一些简单的方法。
HTML页面如下所示:
我的目标是使用HTML Agility Pack遍历整个HTML页面,找出所有类包含“listevent”的div,并将其返回给我。
当我在网上搜索时,发现如果进行映射,这是可能的,但其中一些div位于许多其他div的下面,因此寻找一些简单的方法。
HTML页面如下所示:
<div>
<div>
<table>
<tr>
<td>
<div class="thisone listevent"></td>
<td>
<div class="thisone listevent"></td>
</tr>
</table>
</div>
</div>