Wget JS 重定向

6
当我使用wget时,遇到了使用JS重定向的页面。类似于这样:
<script language="JavaScript1.2">
var s = "i_08/0101/index.php3";
location.href=""+s;
</script>

wget能够跟随这个重定向吗?还是有其他方法可以解决这个问题。
2个回答

4
你可以查看为FAE构建的DHTMLGET工具。该项目的目标是在修改后的wget上提供基本的内联js和onload事件:

dhtmlget实用程序类似于unix中的WGET实用程序,用于创建网站的本地副本。它支持http、https协议以及通过http代理检索。DHTMLGET和WGET的主要区别是dhtmlget ExecuteS onload和内联javascript。它是为伊利诺伊州功能无障碍评估器开发的,以分析使用javascrpt生成可访问性功能的网站。

一个简单的谷歌搜索可以带您到一个有趣的页面,关于wget js特性请求

1

编号。

wget 用于下载远程位置的文件,不会像网页浏览器那样解析其中包含的 JavaScript。

请注意,wget 跟随头部重定向(例如301)。

我尝试使用 lynx -source,但遗憾的是,这也会导致未经解析的网页。解决此问题的替代方案是编写一个脚本,下载页面,然后自动解析并下载可能的引用,但这由你决定。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接