我试图获取所有包含在 bg_block_info
类中的信息,但是我却得到了另一个类别 <div class="bg_block_info pad_20">
的信息。为什么会出现这种错误?
Document doc = Jsoup.connect("http://www.maib.md").get();
Elements myin = doc.getElementsByClass("bg_block_info");
Document doc = Jsoup.connect("http://www.maib.md/").get();
Elements els = doc.getElementsByClass("bg_block_info").not(".pad_10").not(".pad_20");
该元素有两个类(注意bg_block_info
和pad_20
之间的空格):
<div class="bg_block_info pad_20">
所以它确实有类名为bg_block_info
,你的代码按预期工作。
Elements downloadLinks = dContent.select("a[href]");
Elements pdfLinks = downloadLinks.select("a[data-format$=pdf]");
完整参考jsoup选择器语法
只需在bg_block_info"
和"pad_20"
之间使用逗号。应该像这样。
Elements myin = doc.getElementsByClass("div.bg_block_info.pad_20");
Element content = doc.getElementById("pollsstart");
而不是Elements myin = doc.getElementsByClass("bg_block_info");
。