有很多由网站提供的小部件,实际上是由JavaScript生成HTML的,通过DOM操作或document.write()。我想执行JavaScript以生成渲染后的HTML,然后保存该HTML源代码,而不是通过额外的请求让浏览器变得更慢,并信任另一个提供商快速,可靠并且不会更改小部件输出内容。
我已经研究过但看起来行不通或太难的事情:
- Links浏览器(不是lynx!)
- Xvfb加Firefox加Greasemonkey的无头使用(天哪)
- 全Java浏览器工具包Cobra(最好的选择!)
有什么想法吗?
** 显然你不能完全执行 JavaScript,因为它并不一定有一个出口路径,但你已经有了这个想法。