答案:
回答“如果wget中存在文件则跳过下载”的问题建议使用-nc
或--no-clobber
,但-nc
不能防止发送HTTP请求和随后下载文件。如果文件已经完全获取,那么它只是在下载文件后不执行任何操作。是否有任何方法可以在文件已存在时防止发出HTTP请求?
我使用Homebrew安装了wget
1.16.3。执行下面的命令后,wget
会为每个已经存在的文件说一些像"making HTTP request"的话,看起来像是正在下载它,然后又说了一些像"file already retrieved, nothing to do"的话。
wget --user-agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_4) AppleWebKit/600.7.12 (KHTML, like Gecko) Version/8.0.7 Safari/600.7.12' \
--tries=1 \
--no-clobber \
--continue \
--wait=0.3 \
--random-wait \
--adjust-extension \
--load-cookies cookies.txt \
--save-cookies cookies.txt \
--keep-session-cookies \
--recursive \
--level=inf \
--convert-links \
--page-requisites \
--reject=edit,logout,rate \
--domains=example.com,s3.amazonaws.com \
--span-hosts \
--exclude-directories=/admin \
http://example.com/