如何从wget获取真实文件名

6

我正在编写一个Bash脚本,并使用wget从网站上获取一些PDF文件。例如:

wget www.barb.co.uk/news/item-subscriber/id/213/index.html

但是 wget 将文件保存为 index.html。如果我在浏览器中输入该 URL,则会正确下载具有其真实名称的文件 - "BARB Bulletin 25 - December 10.pdf"。
我该如何使 wget 做到这一点?或者是否有其他方法可以从 bash 脚本中找到文件的真实名称?
2个回答

20

你可以使用--content-disposition选项,让wget更深入地查看HTTP响应头部,这通常在大多数情况下都会有所帮助。

示例:

wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html

3
你可以通过在~/.wgetrc文件中添加content_disposition=on来将其设置为默认值。 - rcoup

4

请看wgets的--content-disposition选项。


1
虽然这个链接可能回答了问题,但最好在此处包含答案的基本部分并提供参考链接。如果链接页面更改,仅有链接的答案可能会失效。 - dove
是的,感谢您宝贵的意见。这确实非常有帮助。特别是因为答案中没有链接... - arkascha
喜欢你的讽刺,但这是SO放进去的脚本答案。如果你想要详细信息,我的意思是你只是提供了一个项目的参考,而没有帮助解释它如何使用或为什么它是解决方案。hoeni做到了这一点,而你却错过了。 - dove
2
有什么需要解释的呢?你只需在“wget”命令中添加开关即可。完成。 - Synetech

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接