使用
wget -m -R/--reject
标志几乎能做到我想要的事情,除了所有文件被下载之后,如果它们匹配了 -R 标志,那么它们就会被删除。以下是我如何使用
wget
:wget --http-user userName --http-password password -R index.html,*tiff,*bam,*bai -m http://web.server.org/
产生的输出如下,确认排除的文件(index.html)(a)被下载,然后(b)被删除:
有没有一种方法可以强制wget在下载文件之前拒绝它?是否有其他选择?...
--2012-05-23 09:38:38-- http://web.server.org/folder/
正在重用现有连接到web.server.org:80。
HTTP请求已发送,正在等待响应... 401 需要授权
正在重用现有连接到web.server.org:80。
HTTP请求已发送,正在等待响应... 200 OK
长度:2677 (2.6K) [text/html]
正在保存至: `web.server.org/folder/index.html' 100%[======================================================================================================================>] 2,677 --.-K/s in 0s缺少Last-modified标头——时间戳关闭。
2012-05-23 09:38:39 (328 MB/s) - `web.server.org/folder/index.html' 已保存 [2677/2677]
移除web.server.org/folder/index.html,因为它应该被拒绝。
...
此外,为什么每次下载文件时都会收到“401需要授权”错误,尽管已提供用户名和密码。就像wget在每次尝试用户名/密码之前都会尝试未经身份验证的连接一样。
谢谢,马克