我正在开发一个网络爬虫程序,用于搜索特定的葡萄酒并返回该品种的本地葡萄酒列表。我的问题是多页结果。下面的代码是我正在使用的基本示例。
url2 <- "http://www.winemag.com/?s=washington+merlot&search_type=reviews"
htmlpage2 <- read_html(url2)
names2 <- html_nodes(htmlpage2, ".review-listing .title")
Wines2 <- html_text(names2)
针对这个特定的搜索,共有39页结果。我知道URL会更改为http://www.winemag.com/?s=washington%20merlot&drink_type=wine&page=2,但是否有一种简单的方法让代码循环遍历所有返回的页面,并将所有39页的结果编译成一个列表?我知道可以手动处理所有URL,但那似乎太过繁琐。
cat("boom! ")
替换cat(".")
。可能是个人偏好吧。 - RhodoRSelenium
吗? - Mostafa90