我有几个不同网站上的网页需要完全镜像。这意味着我需要包括图片、CSS等文件,并将链接转换。这个功能类似于使用Firefox中的“保存页面”并选择“完整的网页”。我想给文件和相应的目录起一个合适的名字(例如,myfavpage1.html,myfavpage1.dir)。
我没有访问服务器的权限,这些页面也不是我的。这里是一个样本链接:点击我! 更进一步地说,我有大约100个页面要进行镜像(其中很多来自慢速服务器),我将在Solaris 10上定时运行此任务,并每小时将结果转储到Samba挂载点供人们查看。是的,我显然已经尝试过wget并使用了几个不同的标志,但我没有得到我想要的结果。所以,指向GNU wget页面并不是真正有帮助的。让我从一个简单的例子开始。
我没有访问服务器的权限,这些页面也不是我的。这里是一个样本链接:点击我! 更进一步地说,我有大约100个页面要进行镜像(其中很多来自慢速服务器),我将在Solaris 10上定时运行此任务,并每小时将结果转储到Samba挂载点供人们查看。是的,我显然已经尝试过wget并使用了几个不同的标志,但我没有得到我想要的结果。所以,指向GNU wget页面并不是真正有帮助的。让我从一个简单的例子开始。
wget --mirror -w 2 -p --html-extension --tries=3 -k -P stackperl.html "https://stackoverflow.com/tags/perl"
如果我使用正确的标志,那么我应该在stackper.html文件中看到https://stackoverflow.com/tags/perl页面。