有没有一种方便的方法将w3c文档转换为jsoup文档?

4

我有一个javafx的WebEngine,想要使用Jsoup而不是内置的w3c解析当前网页内容。但是,webEngine.getDocument()返回的是w3c的Document,我找不到很好的方法将它转换为Jsoup的Document。目前唯一想到的办法是将原始的Document转换为字符串,然后使用Jsoup进行解析,这样非常繁琐。


我也是,找到的最好方法是Jsoup.parse(new W3CDom().asString(webEngine.getDocument())); - Profiterole
1个回答

1

这就是我做事的方式,而且效果不错。

WebEngine webEngine = webView.getEngine();
String html = (String) webEngine.executeScript("document.documentElement.outerHTML");

我将字符串“html”传递给JSoup。

这个问题特别指出:“我现在唯一能想到的方法是将原始文档转换为字符串,然后使用Jsoup解析它,这相当笨拙。”你建议做的可能是正确的,但它并没有回答这个问题。 - Profiterole

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接