使用httr R包发送POST请求

21

我无法弄清楚如何模仿浏览器通过POST请求向服务器发送数据时的操作。以下是相关的URL,下面有解释。

(1) http://kenpom.com/

(2) http://kenpom.com/register.php?frompage=1
<form id="login" method="POST" action="handlers/login_handler.php">
<label>E-mail </label><input type="text" name="email" />
<label>Password </label><input type="password" name="password" />
<input type="submit" name="submit" value="Login!" />

(3) http://kenpom.com/team.php?team=Rice

(1) 主页(未登录时选择团队页面,重定向 -> (2))

(2) 登录页面(成功登录后重定向到特定团队页面)

(3) 特定团队页面:例如Rice

url <- ("http://kenpom.com/team.php?team=Rice")

login <- list(
        email = "login",
        password = "password"
)

teampage <- POST(url, body = login)

Response [http://kenpom.com/register.php?frompage=1]
  Date: 2015-03-07 23:04
  Status: 200
  Content-Type: text/html
  Size: 7.45 kB
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<HTML>
<HEAD>
<LINK REL=stylesheet TYPE="text/css" HREF="css/rate.css?1414365416">
<TITLE>kenpom.com subscription</TITLE>

最终想要使用rvest包爬取一些信息,但是尝试爬取http://kenpom.com/register.php?frompage=1时却得到了空的结果。

1个回答

33

尝试

library(httr)
login <- list(
  email = "login",
  password = "password",
  submit = "Login!"
)
res <- POST("http://kenpom.com/handlers/login_handler.php", body = login, encode = "form", verbose())
team <- GET("http://kenpom.com/team.php?team=Rice", verbose())

2
列表中缺少一个逗号(抱歉我无法编辑,只添加一个逗号太短了,需要6个字符)。 - Chelmy88

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接