身份验证和Python Requests

5

我正在尝试使用requests下载一些文档,但页面将我重定向到用户登录界面,因此只能下载HTML页面。

我已经尝试过:

c=requests.get(url,auth=HTTPBasicAuth('user','pass'))

但是我无法通过身份验证。

我也尝试了基本认证和摘要认证。

表单本身看起来像这样:

<input id="username" name="username" class="required" tabindex="1" type="text" value="" size="25" autocomplete="false"/>
<br/>

<label for="password">Password</label>
<input id="password" name="password" class="required" tabindex="2" type="password" value="" size="25" autocomplete="off"/>

我需要在payload中传递用户名和密码吗?如果需要,我该如何做?到目前为止,我已经尝试了几种不同的方法。


这是基本身份验证吗?您是否会收到一个浏览器弹出窗口要求输入用户名和密码,还是一个常规页面,其中包含一个文本字段请求用户名和密码? - Samy Vilar
@samy.vilar 我相信基本身份验证。我试图下载一个文档,它会重定向到另一个页面,显示一个简单的表单(如上部分所示)。 - James R
1个回答

7

基本上,这与从页面中获取身份验证ID并传递cookie有关。

以下是我所做的:

from bs4 import BeautifulSoup as bs
import requests
s = requests.session()
url = r'url_i_care_about'

def authenticate(s, url):
    headers = {'username': 'myuser', 'password': 'mypasss', '_Id': 'submit'}
    page=s.get(url)
    soup=bs(page.content)
    value=soup.form.find_all('input')[2]['value']
    headers.update({'value_name':value})
    auth = s.post(url, params=headers, cookies=page.cookies)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接