如何从wget获取真实文件名

Question

6

我正在编写一个Bash脚本，并使用wget从网站上获取一些PDF文件。例如：

wget www.barb.co.uk/news/item-subscriber/id/213/index.html

但是 wget 将文件保存为 index.html。如果我在浏览器中输入该 URL，则会正确下载具有其真实名称的文件 - "BARB Bulletin 25 - December 10.pdf"。

我该如何使 wget 做到这一点？或者是否有其他方法可以从 bash 脚本中找到文件的真实名称？

- Peter Howe

2个回答

4

请看wgets的--content-disposition选项。

- arkascha

1

虽然这个链接可能回答了问题，但最好在此处包含答案的基本部分并提供参考链接。如果链接页面更改，仅有链接的答案可能会失效。 - dove

是的，感谢您宝贵的意见。这确实非常有帮助。特别是因为答案中没有链接... - arkascha

喜欢你的讽刺，但这是SO放进去的脚本答案。如果你想要详细信息，我的意思是你只是提供了一个项目的参考，而没有帮助解释它如何使用或为什么它是解决方案。hoeni做到了这一点，而你却错过了。 - dove

2

有什么需要解释的呢？你只需在“wget”命令中添加开关即可。完成。 - Synetech

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- hoeni · Accepted Answer

你可以使用--content-disposition选项，让wget更深入地查看HTTP响应头部，这通常在大多数情况下都会有所帮助。

示例：

wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html