28得票3回答
如何将使用Jsoup(Java HTML解析器)创建的文档转换为字符串

我有一个使用jsoup创建的文档,看起来像这样Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 如何将那个 doc 转换为字符串。

28得票4回答
使用Jsoup 1.8.1可以将HTML转换为XHTML吗?

String body = "<br>"; Document document = Jsoup.parseBodyFragment(body); document.outputSettings().escapeMode(EscapeMode.xhtml); String str =...

28得票4回答
JSoup:请求JSON响应

我正在使用JSoup进行身份验证然后连接到一个网站。部分URL会返回JSON响应(因为网站的一部分是用AJAX实现的)。JSoup能够处理JSON响应吗?Connection.Response doc = Jsoup.connect("...") ...

27得票3回答
如何使用Jsoup将数据发布到网站

我正在尝试使用Jsoup将数据POST到网站以进行登录,但它无法正常工作? 这是我的代码 Document docs = Jsoup.connect("http://some.com/login") .data("cmd", "login","username", "x...

27得票6回答
我该如何在JSOUP中选择这个元素?

这是HTML结构: Element link = doc.select("div.subtabs p").first(); 那似乎不起作用。我怎么选择那个 p 元素?

25得票3回答
使用JSOUP选择具有特定ID的<div>元素

我正在为一门课程制作一个小型的Android应用程序,从美国癌症协会的网站上寻找与癌症相关的活动。我一直在使用JSoup获取有关这些事件的基本信息,并尝试使用select()方法获取特定信息。但是,我目前使用的方法会抓取更多的HTML节点,而我无法找出原因。我要抓取的表格如下所示: 编辑:...

25得票4回答
Java - 使用Jsoup获取script标签内的文本

我正在使用Jsoup库读取一个URL,这个URL包含在一些&lt;script&gt;标签中的文本。请问我是否可以获取每个&lt;script&gt;标签内的文本?请注意,我不是在请求解析Javascript文件,因为我已经知道JSoup不允许那样做。实际的源代码中有文本在一个script标签...

25得票4回答
如何在Jsoup解析中避免包含HTML头标签

我使用Jsoup来解析给定的HTML内容。在Jsoup.parse()之后,输出会将html、head和body标签附加到输入中。我只想忽略它们。 样例输入:&lt;p&gt;&lt;b&gt;This &lt;i&gt;is&lt;/i&gt;&lt;/b&gt; &lt;i&gt;my ...

24得票2回答
如何使用jsoup解析HTML中的表格

&lt;td width="10"&gt;&lt;/td&gt; &lt;td width="65"&gt;&lt;img src="/images/sparks/NIFTY.png" /&gt;&lt;/td&gt; &lt;td width="65"&gt;5,390.85&lt;/td...

24得票5回答
在JSoup中按类名获取元素

我试图获取所有包含在 bg_block_info 类中的信息,但是我却得到了另一个类别 &lt;div class="bg_block_info pad_20"&gt; 的信息。为什么会出现这种错误?Document doc = Jsoup.connect("http://www.maib.m...