基本上,我正在尝试运行一些代码(Python 2.7),如果网站上的内容发生更改,就运行它,否则等待一会儿并稍后再检查。
我想比较哈希值,但问题是,如果页面更改了单个字节或字符,哈希值将不同。例如,如果页面在页面上显示当前日期,则每次哈希值都会不同,并告诉我内容已更新。
那么...你会怎么做呢?您会查看HTML的Kb大小吗?您会查看字符串长度,并检查例如长度是否增加了5%,内容已经“更改”?还是有某种哈希算法,如果仅更改了字符串/内容的一小部分,则哈希值保持不变?
关于last-modified - 不幸的是,并非所有服务器都正确返回此日期。我认为这不是可靠的解决方案。我认为更好的方法是结合哈希和内容长度解决方案。检查哈希,如果发生更改-检查字符串长度。