如何在HTTP请求中使用urllib2发送自定义的标头?

68

我想在使用urllib2.urlopen(..)时,向我的请求中发送一个自定义的"Accept"头。我该怎么做?

3个回答

132

不完全正确。创建一个Request对象并不会实际发送请求,而且Request对象没有Read()方法。(另外:read()是小写)。你需要做的就是将Request作为第一个参数传递给urlopen(),这样就可以得到响应。

import urllib2
request = urllib2.Request("http://www.google.com", headers={"Accept" : "text/html"})
contents = urllib2.urlopen(request).read()

18

我通常使用:

import urllib2

request_headers = {
"Accept-Language": "en-US,en;q=0.5",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Referer": "http://thewebsite.com",
"Connection": "keep-alive" 
}

request = urllib2.Request("https://thewebsite.com", headers=request_headers)
response = urllib2.urlopen(request).read()
print(response)

2
除了已经提到的其他解决方案,你还可以使用add_header方法。
因此,@pantsgolem提供的示例将如下所示:
import urllib2
request = urllib2.Request("http://www.google.com")

request.add_header('Accept','text/html')

##Show the header having the key 'Accept'
request.get_header('Accept')

response = urllib2.urlopen(request)
response.read()

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接