我正在编写一个Bash脚本,并使用wget从网站上获取一些PDF文件。例如:
wget www.barb.co.uk/news/item-subscriber/id/213/index.html
但是 wget 将文件保存为 index.html。如果我在浏览器中输入该 URL,则会正确下载具有其真实名称的文件 - "BARB Bulletin 25 - December 10.pdf"。
我该如何使 wget 做到这一点?或者是否有其他方法可以从 bash 脚本中找到文件的真实名称?
你可以使用--content-disposition
选项,让wget更深入地查看HTTP响应头部,这通常在大多数情况下都会有所帮助。
示例:
wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html
请看wgets的--content-disposition
选项。
~/.wgetrc
文件中添加content_disposition=on
来将其设置为默认值。 - rcoup