我想用Java程序爬取以下链接的全部内容。第一页没问题,但当我想爬取下一页的数据时,源代码与第一页相同。因此,简单的HTTP Get一点用也没有。
这是我需要爬取的页面链接。
该网站有活动内容,需要由HMTL/CSS/JavaScript渲染引擎解释和执行。因此,我有一个使用PhantomJS的简单解决方案,但在Java中运行PhantomJS代码很复杂。
有没有更容易的方法用Java代码读取整个页面的内容?我已经搜索了解决方案,但找不到合适的。
该网站有活动内容,需要由HMTL/CSS/JavaScript渲染引擎解释和执行。因此,我有一个使用PhantomJS的简单解决方案,但在Java中运行PhantomJS代码很复杂。
有没有更容易的方法用Java代码读取整个页面的内容?我已经搜索了解决方案,但找不到合适的。
感谢您的帮助,
敬礼。