如何获取任何url或网页的Googlecaching年龄?
在我的项目中,我需要将Googlecaching年龄添加为重要信息。 我试图searchGooglecaching时代的来源,也就是Google上次重新编制索引后的天数。
我在哪里可以获得Googlecaching年龄?
使用url
http://webcache.googleusercontent.com/search?q=cache:<your url without "http://">
例:
http://webcache.googleusercontent.com/search?q=cache:stackoverflow.com
它包含一个像这样的标题:
这是Google的https://stackoverflow.com/caching。; 这是页面的快照,因为它出现在2012年8月21日11:33:38 GMT。 当前页面可能在此期间已经改变。 学到更多
提示:要在此页面上快速find您的search字词,请按Ctrl + F或⌘ + F (Mac)并使用查找栏。
您需要刮取结果页面,但是您可以使用以下URL查看最新的caching页面:
http://webcache.googleusercontent.com/search?q=cache:www.something.com/path
Google信息放在body标签的第一个div中。
你可以使用CachedPages网站
caching页面通常由具有强大Web服务器的大公司保存和存储。 由于这些服务器通常速度非常快,因此caching页面通常可以比实时页面更快地访问:
- Google通常保留最近的一页(1至15天)。
- 珊瑚也保留最近的版本,虽然通常不如Google。
- 通过Archive.org,您可以访问多年来保存的网页的多个副本。
它太简单了,你可以在页面的URL之前input“cache:”。 例如,如果你想检查这个页面的最后一个web cache:http://stackoverflow.com/questions/4560400/how-can-i-get-the-google-cache-age-of-any-url-or-web-page
只需inputURL栏cache:http://stackoverflow.com/questions/4560400/how-can-i-get-the-google-cache-age-of-any-url-or-web-page
这将显示页面的最后一个webcaching。请看这里:
但请记住,网页的caching将只显示该网页是否已经在search引擎(Google)上编入索引。 为此,您需要检查该页面的元机器人标签。
这一个很好也查看caching页面http://www.cachepage.net
-
通过googlecaching页面视图:webcache.googleusercontent.com/search?q=cache:您的url
-
通过archive.orgcaching页面视图:web.archive.org/web/*/您的url
我使用FromCache.com作为从Google获取caching页面的方便快捷方式。
快照的年龄始终显示在标题中。