得票数最多 'jsoup' 问题 - 第4页

关联标签

23得票4回答

我正在使用JSoup解析来自http://www.latijnengrieks.com/vertaling.php?id=5368的内容。这是一个第三方网站，没有指定正确的编码方式。我正在使用以下代码加载数据：public class Loader { public static...

23得票2回答

在Jsoup中，有没有一种方法可以从需要基本身份验证的网站加载文档？

22得票2回答

我已经使用以下方法将网页获取为一个org.jsoup.nodes.Document对象： myDoc = Jsoup.connect(myURL).ignoreContentType(true).get(); 我该如何将这个对象写入HTML文件中呢？ myDoc.html(), myDoc...

22得票9回答

更新 Boilerpipe 看起来非常好用，但我意识到我不仅需要主要内容，因为许多页面没有文章，只有链接和一些短描述指向整个文本（这在新闻门户网站中很常见），而我不想放弃这些短文字。如果有一个 API 可以做到这一点，获取不同的文本部分/块并将每个部分分成某种方式（与单个文本不同），请报...

21得票3回答

我发现了许多主题都有类似的问题和宝贵的答案，但我仍然在努力解决这个问题：我想用Jsoup解析一些html，这样我就可以替换，例如，"changeme" <changed>changeme</changed> ，但仅当它出现在HTML文本部分时才会生效，如果它是标记的一...

21得票3回答

编辑：我的 Proguard 版本是 4.7 今天我尝试在我的安卓应用中引入 jsoup（版本 1.7.1），但它给我带来了很多麻烦。当我使用 proguard 导出签名的 apk 并且开启时，每次我的应用都会遇到强制关闭问题，然后我禁用了 proguard 并导出了 apk，它就可以完美运...

21得票3回答

嗨，我正在编写一个程序，用于检查许多不同的URL是否存在。我基本上只是检查返回的错误代码是否为404。由于我要检查超过1000个URL，因此希望能够快速完成。以下是我的代码，我想知道如何修改它以使其更快（如果可能）：final URL url = new URL("http://www.e...

21得票3回答

我想要在这里登录。源代码<HTML><HEAD><TITLE>:: Dhaka Electric Supply Company Limited (DESCO)::</TITLE> <META http-equiv=Content-Typ...

21得票1回答

我有一个类似以下问题的问题： jQuery：从.text（）中排除子元素在JSoup中是否可能实现这一点？

21得票1回答

我有一个像这样的元素：<td> TextA <br/> TextB </td> 如何将TextA和TextB分别提取出来？