我们正在关闭The Conversations Network(包括IT Conversations播客)。计划是为永久托管在Internet Archive的网站生成静态HTML版本。
如何最简单地从目前由PHP动态生成的大约5,000个动态页面中生成静态HTML?
我知道我们可以调整代码来缓存PHP输出,将其写入文件,然后遍历站点地图以生成每个页面。但我想知道是否有任何我们应该考虑的选项。有没有工具可以这样做并爬取HTML?(除了Acrobat Pro之外的其他工具?)
不幸的是,我们还有相当数量的Ajax调用,这将使事情变得更加困难。我想我们必须先取消Ajax。