有没有办法从Wayback机器上恢复整个网站?
我有一个旧网站被存档了,但现在已经没有网站文件可以重新恢复它。是否有一种方法可以恢复旧数据,以便我可以找回失落已久的文件?
有没有办法从Wayback机器上恢复整个网站?
我有一个旧网站被存档了,但现在已经没有网站文件可以重新恢复它。是否有一种方法可以恢复旧数据,以便我可以找回失落已久的文件?
wget 是一个很棒的工具,可以镜像整个网站。如果你使用Windows系统,可以使用Cygwin来安装它。下面的命令将会镜像整个网站:wget -m domain.name
下面的示例命令使用了一起使用了多个参数:禁止向上查找父目录(-np
),忽略robots.txt(-e robots=off
),使用CDN域名(--domains=domain.name
),并镜像某个URL(要镜像的URL是http://an.example.com
)。所有这些参数全部放在一起得到如下命令:
wget -np -e robots=off --mirror --domains=staticweb.archive.org,web.archive.org http://web.archive.org/web/19970708161549/http://www.google.com/
如果你正在处理 https
和自签名证书,可以使用 --no-check-certificate
来禁用证书检查。wget 帮助是查看可能选项的最佳地方。
-np
帮助保持在指定的日期路径上,不会离开它。 - Ray
gem install wayback_machine_downloader
然后使用要检索的网站的基本URL作为参数运行它:wayback_machine_downloader http://example.com
更多信息请参见:https://github.com/hartator/wayback_machine_downloader - Hartator