我有如下问题。我需要镜像密码保护的网站。听起来是一个简单的任务:
wget -m -k -K -E --cookies=on --keep-session-cookies --load-cookies=myCookies.txt http://mysite.com
在myCookies.txt文件中,我正保存着正确的会话cookie。这有效,直到wget访问注销页面为止-然后会话被作废,进一步的镜像就毫无意义。
我们尝试添加“--reject”选项,但它仅适用于文件类型-我只能阻止html文件下载或swf文件下载,我无法指定哪些文件可下载。
--reject http://mysite.com/*.php?type=Logout*
有什么办法可以在wget中跳过某些URL?也许有其他工具可以完成这项工作(必须在MS Windows上运行)。
touch page.php?type=Logout
然后执行了wget --no-clobber http://tkos.co.il/page.php?type=Logout
,结果显示File 'page.php?type=Logout' already there; not retrieving.
- Eli Rosencruft