假设我的网站有多个页面。这些页面的排名是基于它们被查看的次数。如果一个页面的排名很高,则在搜索结果中它将显示得更靠前。因此,页面的作者可能会试图操纵系统,以增加该特定页面的查看次数。
那么如何在保持准确计数的同时防止这种情况呢?
我想出了以下“方案”:
一个用户每个会话只能影响页面浏览一次。这是我通常期望的。如果用户稍后返回网站并再次查看页面,则应将其视为另一个页面查看。
问题在于,这使得页面查看次数增量容易受到在每个请求之前清除其 cookie 的脚本的攻击。解决此问题最简单的方法是保存 IP 地址,并仅允许相同的 IP 地址增加页面计数一次。然而,这有几个主要缺点;首先,这可能会占用大量存储空间,其次,这将阻止大型局域网上的用户增加页面计数。最后,用户无法从相同的 IP 重新访问页面并增加页面查看次数。我可以接受这一点,但宁愿不这样做。
我能想到的最好的方法是保存最近的X个 IP 地址,并且不允许来自这些 IP 地址的任何人影响页面浏览计数。这将有效阻止任何(简单)脚本增加页面查看次数。此外,可能最好在实际查看计数的显示中添加延迟(基本上保持两个计数和一个日期时间字段用于“显示”计数是上次使用“实际”计数更新的内容,我相信 SE 站点也是这样做的)。
这不是一个完美的解决方案,因此我很乐意听取您的建议或意见。
那么如何在保持准确计数的同时防止这种情况呢?
我想出了以下“方案”:
一个用户每个会话只能影响页面浏览一次。这是我通常期望的。如果用户稍后返回网站并再次查看页面,则应将其视为另一个页面查看。
问题在于,这使得页面查看次数增量容易受到在每个请求之前清除其 cookie 的脚本的攻击。解决此问题最简单的方法是保存 IP 地址,并仅允许相同的 IP 地址增加页面计数一次。然而,这有几个主要缺点;首先,这可能会占用大量存储空间,其次,这将阻止大型局域网上的用户增加页面计数。最后,用户无法从相同的 IP 重新访问页面并增加页面查看次数。我可以接受这一点,但宁愿不这样做。
我能想到的最好的方法是保存最近的X个 IP 地址,并且不允许来自这些 IP 地址的任何人影响页面浏览计数。这将有效阻止任何(简单)脚本增加页面查看次数。此外,可能最好在实际查看计数的显示中添加延迟(基本上保持两个计数和一个日期时间字段用于“显示”计数是上次使用“实际”计数更新的内容,我相信 SE 站点也是这样做的)。
这不是一个完美的解决方案,因此我很乐意听取您的建议或意见。