如何获取任何URL或网页的Google缓存年龄?

264

在我的项目中,我需要将Google缓存的年龄作为重要信息添加。我试图搜索Google缓存年龄的来源,也就是自Google上次重新索引页面以来的天数。

我可以在哪里获得Google缓存年龄信息?


http://webapps.stackexchange.com/questions/15633/how-to-modify-a-url-to-get-a-google-cached-version-of-page - Thomas
6个回答

380

使用URL

https://webcache.googleusercontent.com/search?q=cache:<your url without "http://">

示例:

https://webcache.googleusercontent.com/search?q=cache:stackoverflow.com

它包含了以下这个头部信息:

这是谷歌对https://stackoverflow.com/的缓存。它是该页面在 GMT 时间 2012 年 8 月 21 日 11:33:38 显示时的快照。当前页面可能已发生更改。了解更多
提示:要在本页面上快速查找您的搜索词,请按Ctrl+F+F(Mac),使用查找栏。


哇,它甚至可以绕过“robots.txt”文件;我用它来阅读博客,因为我们公司的防火墙禁用了它的URL。 - Gabor
26
你也可以在Google搜索中使用“cache:”搜索运算符。 - shea
2
对于 https,需要添加 https:// 部分,否则返回 404。 - Stalinko
这个网站可以自动实现这个功能: https://www.cachedview.me/ - lmaooooo
@lmaooooo 请将其作为单独的答案添加。 - Sean Patrick Floyd

18

您需要爬取生成的页面,但是您可以使用此URL查看最新的缓存页面:

http://webcache.googleusercontent.com/search?q=cache:www.something.com/path

Google信息放在body标签下的第一个div中。


15

您可以使用CachedPages网站。

缓存页面通常由具有强大 Web 服务器的大型公司保存和存储。由于这样的服务器通常非常快,因此缓存页面往往比实时页面本身更快访问:

  • Google通常保留页面的最新副本(1到15天)。
  • Coral也保留一个最近的副本,尽管它通常不如Google那么新。
  • 通过Archive.org,您可以访问保存在多年中的多个网页副本。

5
这很简单,您只需要在页面URL之前输入“cache:”。例如,如果您想查看此页面的上一个Web缓存,请在URL栏中键入cache:https://dev59.com/eW455IYBdhLWcg3wD_2Z 这将显示页面的上一个Web缓存。请参见以下截图: enter image description here 但请记住,网页的缓存仅在页面已经被搜索引擎(Google)索引时才会出现。为此,您需要检查该页面的meta robot标签。

我曾长期使用这个。但最近似乎在像medium.com这样的网站上失效了。 - blueren

1
你可以使用这个网站:https://cachedviews.com/。缓存查看或缓存任何网站的页面 - 谷歌缓存任何网站的页面。

-1

这个也可以查看缓存页面 http://www.cachepage.net

  1. 通过谷歌缓存页面查看:webcache.googleusercontent.com/search?q=cache: 您的网址

  2. 通过archive.org缓存页面查看:web.archive.org/web/*/您的网址


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接