使用rvest爬取带有登录页面的网站

Question

使用rvest爬取带有登录页面的网站

4

以下是我的代码：

library(rvest)

#login
url <- "https://secure.usnews.com/member/login?ref=https%3A%2F%2Fpremium.usnews.com%2Fbest-graduate-schools%2Ftop-medical-schools%2Fresearch-rankings"
session <- html_session(url)

form <- html_form(read_html(url))[[1]]

filled_form <- set_values(form,
                          username = "notmyrealemail",
                          password = "notmyrealpassword")

submit_form(session, filled_form)

以下是我提交表单后得到的输出结果：submit_form。

<session> https://premium.usnews.com/best-graduate-schools/top-medical-schools/research-rankings
  Status: 200
  Type:   text/html; charset=utf-8
  Size:   286846

我假设这意味着它起作用了？如果是这样的话，我该如何在登录后出现的页面上使用read_html？

- GT.

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- GT. · Accepted Answer

通过使用 url <- jump_to(session, "https://premium.usnews.com/best-graduate-schools/top-medical-schools/research-rankings")，我成功地解决了问题。