23得票4回答
JSoup字符编码问题

我正在使用JSoup解析来自http://www.latijnengrieks.com/vertaling.php?id=5368的内容。 这是一个第三方网站,没有指定正确的编码方式。 我正在使用以下代码加载数据:public class Loader { public static...

23得票2回答
Jsoup连接基本访问认证

在Jsoup中,有没有一种方法可以从需要基本身份验证的网站加载文档?

22得票2回答
如何将Jsoup文档保存为HTML文件?

我已经使用以下方法将网页获取为一个org.jsoup.nodes.Document对象: myDoc = Jsoup.connect(myURL).ignoreContentType(true).get(); 我该如何将这个对象写入HTML文件中呢? myDoc.html(), myDoc...

22得票9回答
如何从HTML页面中提取仅主要文本内容?

更新 Boilerpipe 看起来非常好用,但我意识到我不仅需要主要内容,因为许多页面没有文章,只有链接和一些短描述指向整个文本(这在新闻门户网站中很常见),而我不想放弃这些短文字。 如果有一个 API 可以做到这一点,获取不同的文本部分/块并将每个部分分成某种方式(与单个文本不同),请报...

21得票3回答
使用jsoup仅在文本部分替换字符串

我发现了许多主题都有类似的问题和宝贵的答案,但我仍然在努力解决这个问题: 我想用Jsoup解析一些html,这样我就可以替换,例如,"changeme" <changed>changeme</changed> ,但仅当它出现在HTML文本部分时才会生效,如果它是标记的一...

21得票3回答
使用Proguard关闭Jsoup时出现强制关闭的问题

编辑:我的 Proguard 版本是 4.7 今天我尝试在我的安卓应用中引入 jsoup(版本 1.7.1),但它给我带来了很多麻烦。当我使用 proguard 导出签名的 apk 并且开启时,每次我的应用都会遇到强制关闭问题,然后我禁用了 proguard 并导出了 apk,它就可以完美运...

21得票3回答
Java - 检查URL是否存在的最快方法

嗨,我正在编写一个程序,用于检查许多不同的URL是否存在。 我基本上只是检查返回的错误代码是否为404。 由于我要检查超过1000个URL,因此希望能够快速完成。以下是我的代码,我想知道如何修改它以使其更快(如果可能):final URL url = new URL("http://www.e...

21得票3回答
如何使用jsoup提交登录表单?

我想要在这里登录。 源代码<HTML><HEAD><TITLE>:: Dhaka Electric Supply Company Limited (DESCO)::</TITLE> <META http-equiv=Content-Typ...

21得票1回答
Jsoup排除子元素在.text()中的影响

我有一个类似以下问题的问题: jQuery:从.text()中排除子元素 在JSoup中是否可能实现这一点?

21得票1回答
如何使用Jsoup提取独立的文本节点?

我有一个像这样的元素:<td> TextA <br/> TextB </td> 如何将TextA和TextB分别提取出来?