我正在使用JSoup执行以下代码
Document parse = Jsoup.connect("http://www.google.com/movies?near=<MyCity>&sort=1&start=0")
.followRedirects(true)
.ignoreContentType(true)
.timeout(12000)
.userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0")
.referrer("http://www.google.com")
.execute()
.parse();
Elements elements = parse.select(".movie_results .movie");
但是当我检查元素
时,它明显缺少很多内容。我试图从上面的页面中获取电影标题和描述。
我错过了什么?这可能与缺少头部参数、cookie有关吗?还有其他的库可以解决这个问题吗?
我可以通过执行以下命令来重现相同的问题:
curl http://www.google.com/movies?near=<MyCity>&sort=1&start=0 > page.html
小提示
仅强调其中一条评论:try.jsoup.org 是开始使用 Jsoup 的好地方。它可以帮助您以非常干净的方式解析 HTML。
如果您喜欢这个提示并挽救了您的一天,请点赞:D