我有一个非常简单的HTML页面(目录列表),我尝试使用urllib读取该页面,方法如下:
page = urllib.urlopen(coreRepositoryUrl).read()
问题在于,我读取的这个HTML版本比最新版本还要旧。
info()
函数返回以下结果:Date: Fri, 19 Apr 2013 18:48:09 GMT
Server: Apache/2.0.52 (Fedora)
Content-Type: text/html; charset=UTF-8
Connection: close
Age: 481084
页面最后更新于今天(2013年04月25日)。 哪个组件可能是缓存组件?
urlopen().info()
在我这里对_google.com_起作用(PasteBin)。 - awesoonurllib
可能会使用自己的缓存(在某些条件下,请参见tempcache
,ftpcache
inURLopener
),该缓存与 http 缓存无关。urllib.urlcleanup()
清除缓存。urllib2
不缓存任何内容。 - jfs