使用JSoup提取HTML表格内容

9

如何提取位于以下位置的表格内容: /id/2/year/2012/acc-conference">http://espn.go.com/mens-college-basketball/conferences/standings//id/2/year/2012/acc-conference

我看到的一些例子并不太清楚如何获取表格内容。 有人能提供帮助吗?


http://espn.go.com/mens-college-basketball/conferences/standings//id/2/year/2012/acc-conference 返回 404 找不到错误: 您请求的 URL 不存在,但您可能会对以下内容感兴趣。 您确定这是正确的 URL 吗? - Indrek Kõue
那个URL不正确,这是正确的:http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference - Johnny Rocket
1个回答

18

您可能已经解决了这个问题,但是这将遍历每个表并打印出团队名称和胜利/失败列。根据您需要的信息进行调整。第二个表格的格式显然不同,因此如果您想从该表格获取不同的信息,则需要进一步调整。如果您需要更多帮助,请告诉我。

    Document doc = Jsoup.connect("http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference").get();

    for (Element table : doc.select("table.tablehead")) {
        for (Element row : table.select("tr")) {
            Elements tds = row.select("td");
            if (tds.size() > 6) {
                System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
            }
        }
    }

"Elements" 是打错了,应该是 "Element"。 - Don Larynx

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接