我想从一个HTML页面中获取数据(进行抓取),但是其中包含了用Javascript编写的评论。在正常的Java URL获取中,我只能获取到未执行Javascript的HTML内容。我需要最终执行Javascript的页面。
例如:- http://www.glamsham.com/movies/reviews/rowdy-rathore-movie-review-cheers-for-rowdy-akki-051207.asp
该页面有Facebook插件评论,这些评论被当做Javascript获取。
类似于此的还有这个链接: http://www.imdb.com/title/tt0848228/reviews
我该怎么办?