我已经使用以下方法将网页获取为一个
在解析过程中,一些javascript元素中的信息可能会丢失。例如,Instagram媒体页面的源代码中的“timestamp”。
org.jsoup.nodes.Document
对象:
myDoc = Jsoup.connect(myURL).ignoreContentType(true).get();
我该如何将这个对象写入HTML文件中呢?
myDoc.html()
, myDoc.text()
和myDoc.toString()
方法无法输出文档的所有元素。在解析过程中,一些javascript元素中的信息可能会丢失。例如,Instagram媒体页面的源代码中的“timestamp”。
myDoc.html()
时,您缺少哪些元素? - cy3er