我正在尝试使用urllib2打开一个页面,但是一直收到连接超时错误。
我使用的代码行是:
f = urllib2.urlopen(url)
具体错误信息如下:
URLError: <urlopen error [Errno 110] Connection timed out>
我正在尝试使用urllib2打开一个页面,但是一直收到连接超时错误。
我使用的代码行是:
f = urllib2.urlopen(url)
具体错误信息如下:
URLError: <urlopen error [Errno 110] Connection timed out>
urllib2
会遵守 robots.txt 规则。许多网站都会阻止默认的 User-Agent
。
尝试添加一个新的 User-Agent
,方法是创建 Request
对象并将其用作 urlopen
的参数:
import urllib2
request = urllib2.Request('http://www.example.com/')
request.add_header('User-agent', 'Mozilla/5.0 (Linux i686)')
response = urllib2.urlopen(request)
有几个详细的步骤可供参考,例如http://www.doughellmann.com/PyMOTW/urllib2/
urllib2.urlopen(url)
生成的流量。你可能能够看到错误的来源在哪里。