我希望能够解析HTML页面并获取表格的值。例如,通过解析它来获取字典列表,每个列表元素都对应表中的一行。
假设表格如下:
我通过两种方式实现这个目标:
假设表格如下:
<table style="width:100%">
<tr>
<td>Jill</td>
<td>Smith</td>
<td>50</td>
</tr>
<tr>
<td>Eve</td>
<td>Jackson</td>
<td>94</td>
</tr>
</table>
结果
[Jill, Smith, 50]
[Eve, Jackson, 94]
我通过两种方式实现这个目标:
Using Xpath :
page.body.div.table.tr.time;
Using closure like this:
page."**".findAll { it.@class.toString().contains("time")}.each {
这两种方法都使用XMLSlurper:
@Grab(group='org.ccil.cowan.tagsoup', module='tagsoup', version='1.2')
def parser = new XmlSlurper(new org.ccil.cowan.tagsoup.Parser())
那么使用Groovy获取表格值还有其他方法吗?
感谢您的帮助!