我正在用Java编写一个非常基本的网络爬虫。我面临一个问题,就是加载同一URL的内容与浏览器中的不同。例如,请尝试下面的URL。
如果您在浏览器中加载此URL,并通过JAVA URL类,内容将不同。这可能是由于以下原因:- Javascript可能正在发送XMLHTTP请求并将结果连接起来以呈现最终的HTML。 - URL重定向最终可能呈现HTML。 - 其他我不知道的原因。
那么,在我的Java程序中是否有一种模拟浏览器的方法?是否有任何第三方库,可以加载与浏览器类似的页面,并最终返回内容?任何帮助都将不胜感激。