本文http://www.ajnr.org/content/30/7/1402.full包含四个html表格链接,我想使用rvest进行抓取。
通过css选择器的帮助:
"#T1 a"
按照以下方式,可以到达第一个表格:
library("rvest")
html_session("http://www.ajnr.org/content/30/7/1402.full") %>%
follow_link(css="#T1 a") %>%
html_table() %>%
View()
这是CSS选择器:
".table-inline li:nth-child(1) a"
这使得选择包含链接到四个表格的标签的所有四个HTML节点成为可能:
library("rvest")
html("http://www.ajnr.org/content/30/7/1402.full") %>%
html_nodes(css=".table-inline li:nth-child(1) a")
如何循环遍历这个列表并一次性检索全部4个表格?最佳方法是什么?