如何使用wget/curl下载给定网页上所有.zip文件的链接？

Question

如何使用wget/curl下载给定网页上所有.zip文件的链接？

curldownloadwget

86

一个页面包含一组.zip文件的链接，我希望将它们全部下载。我知道可以使用wget和curl来完成，具体该如何操作呢？

- uyetch

3个回答

94

这个解决方案对我没用。只有这个才有效：

wget -r -l1 -H -t1 -nd -N -np -A.mp3 -erobots=off [url of website]

选项的含义：

-r            recursive
-l1           maximum recursion depth (1=use only this directory)
-H            span hosts (visit other hosts in the recursion)
-t1           Number of retries
-nd           Don't make new directories, put downloaded files in this one
-N            turn on timestamping
-A.mp3        download only mp3s
-erobots=off  execute "robots.off" as if it were a part of .wgetrc

- K.-Michael Aye

2

使用wget下载网站上的所有音乐文件 - James Jeffery

是的，谢谢！我不记得它来自哪里了，它只是躺在我的脚本里。 - K.-Michael Aye

1

+1 是针对 -H 开关的。这就是导致第一个答案（也是我在 SO 上查找之前尝试的）无法正常工作的原因。 - Alex

1

不对，你在2013年9月10日回答过这个问题。 - Quasímodo

1

哦，我一定是想错了，九月应该是7月！谁把这个月变成第九个月的？（当然，是罗马人...） - K.-Michael Aye

显示剩余4条评论

7

对于其他需要一些并行魔法的场景，我使用：

curl [url] | grep -i [filending] | sed -n 's/.*href="\([^"]*\).*/\1/p' |  parallel -N5 wget -

- M Lindblad

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- creaktive · Accepted Answer

命令如下：

该命令是：

wget -r -np -l 1 -A zip http://example.com/download/

选项的含义：

-r,  --recursive          specify recursive download.
-np, --no-parent          don't ascend to the parent directory.
-l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).
-A,  --accept=LIST        comma-separated list of accepted extensions.