如何查找网页上次更新的时间?

有没有办法找出自网页更改以来已经过去了多less时间?

例如,我有一个页面托pipe在: www.mywebsitenotupdated.com

有没有办法找出这个HTML页面上传到服务器?

非常重要的是,我没有访问服务器; 只是一个网页的链接。

不,你不知道什么时候页面最后更新或最后更改或上传到服务器(这可能,这取决于解释,是三种不同的东西),只需访问页面。

一个服务器可能(也应该按照HTTP 1.1协议)发送一个Last-Modified头 ,你可以通过几种方式find它,例如使用Rex Swain的HTTP Viewer 。 但是,根据协议,这只是“原始服务器认为变体最后修改的date和时间”。 协议实际上增加了:“这个头域的确切含义取决于原始服务器的实现和原始资源的性质。 对于文件,可能只是文件系统上次修改时间。 对于具有dynamic包含的部分的实体,它可能是其组成部分的最后修改时间的最近的集合。 对于数据库网关,它可能是logging的最后更新时间戳记。 对于虚拟对象,这可能是内部状态最后一次改变。“

实际上,网页通常是从内容pipe理系统或其他方式dynamic创build的,在这种情况下, Last-Modified标题通常会显示创build响应的数据标记,通常与请求时间非常接近。 这意味着在这种情况下,标题实际上是无用的。

即使在“静态”页面的情况下(服务器只是拾取与请求相匹配的文件并发送), Last-Modifieddate标记通常表示服务器上文件的最后一次写入访问。 这可能与从备份副本恢复文件的时间,或在服务器上修改文件而未对内容进行任何更改的时间,或与将文件上载到服务器的时间相关,可能会更换旧的相同的副本。 在这些情况下,假设时间戳在技术上是正确的,则表示页面未被改变的时间(但不一定是最后改变的时间)。

打开浏览器控制台( ? )并input以下内容:

 javascript:alert(document.lastModified) 

为了检查Last Modified标题,你可以使用httpie ( docs )。

安装

 pip install httpie --user 

用法

 $ http -h https://martin-thoma.com/author/martin-thoma/ | grep 'Last-Modified\|Date' Date: Fri, 06 Jan 2017 10:06:43 GMT Last-Modified: Fri, 06 Jan 2017 07:42:34 GMT 

Date很重要,因为这会报告服务器时间,而不是当地时间。 另外,不是每个服务器都发送Last-Modified (例如超级用户似乎不这样做)。

对我来说是这样的

 article:modified_time 

在页面源中。

查看页面源代码

我写了一个关于这个的博客,它显示了一些简单的步骤来检查您的网站上次更新的date和时间。 https://sachinapatel.wordpress.com/您可以在第一篇博文上查看;

还有另一种方法来find页面更新,这可能是有用的一些场合(如果工作:)。

如果页面已被Google或Wayback Machine编入索引,您可以尝试找出哪些date是由他们保存的(这些方法不适用于任何页面,并且有一些限制,这些限制广泛地进行了调查在这个webmasters.stackexchange 问题的答案 ,但在很多情况下,他们可以帮助您找出页面更新date:

  1. Google方式:通过链接https://www.google.com.ua/search?q=site%3Awww.example.com&biw=1855&bih=916&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000%2Ccd_max% 3A和TBM =
    • 您可以通过任何您想要的页面URL来更改search字段中的文本。
    • 例如, 当前的计算器问题页面search给我们作为结果2014年5月14日 – 这是问题创builddate: 在这里输入图像说明
  2. Wayback机器方式:通过链接https://web.archive.org/web/*/www.example.com
    • 对于这个stackoverflow页面wayback机器给我们更多的结果: Saved 6 times between June 7, 2014 and November 23, 2016. ,您可以查看每个date的所有保存副本