我正在尝试镜像一个使用客户端生成的疯狂JavaScript菜单的网站。由于JS代码运行之前链接根本不存在,因此
我已经尝试将主索引页面加载到浏览器中。这会运行JS代码,构建菜单并将结果DOM转储到HTML文件中,然后从该文件进行镜像。由于链接已经在源代码中,因此这会下载更多的文件。但是,显然,在包含未解释JS菜单的其他新下载页面上,镜像很快就会中断。
我考虑用静态版本的菜单替换每个下载页面的菜单部分,但我找不到任何
wget
和httrack
都无法下载整个网站。我该怎么办?我已经尝试将主索引页面加载到浏览器中。这会运行JS代码,构建菜单并将结果DOM转储到HTML文件中,然后从该文件进行镜像。由于链接已经在源代码中,因此这会下载更多的文件。但是,显然,在包含未解释JS菜单的其他新下载页面上,镜像很快就会中断。
我考虑用静态版本的菜单替换每个下载页面的菜单部分,但我找不到任何
wget
或httrack
标志,可以让我通过外部命令运行下载的文件。我可以编写一个简单的过滤代理,但那听起来有点极端。还有其他想法吗?