过期的页面排名算法

4
我正在寻找一种算法,可以进行某种页面排名,但会随着页面变老而降低其价值。
我看到的所有算法都是相反的(给予更老的域更多的价值)。
希望能够帮助找到这样的算法。
编辑: 看到我的初始问题,我认为我没有很清楚地表达我的问题,而且问题比我最初想象的更加复杂。 基本上,我想要一种排名算法,如果站点A在站点B发布文章后立即链接到站点B,那么站点B的页面将获得额外的页面排名(也许“分数”是一个更好的词),但如果站点A在文章发布后很长时间才链接到站点B,则对页面排名几乎没有影响。
希望这有意义。对于初始问题的错误,表示歉意。

最好按照从旧到新的顺序呈现你尝试过但无法更改的算法。 - Saeed Amiri
@SaeedAmiri:OP明确提到了他正在使用的算法:PageRank。这个问题对于任何熟悉这个算法的人来说都是清晰的和众所周知的。 - amit
@amit,我知道PageRank,但它有一些变化,而且OP没有提到为什么他不能使用它(稍作修改)来使用最新的帖子。 - Saeed Amiri
@amit,根据我在你的回答中看到的OP的评论,他似乎不熟悉算法,因此最好让他展示自己的尝试,然后再尝试使用我们的帮助。 - Saeed Amiri
我不一定非要使用Page Rank,但它是我目前在一系列调查中的研究方向。如果有其他建议,我也很乐意听取。 - user956400
1个回答

5
你可以使用Haveliwala在文章中描述的偏置页面排名
这个想法很简单,不使用常规的随机组件:[1/n,1/n,....,1/n],而是使用一个有偏差的随机组件,当你进行随机游走时,不是以概率1/n到达每个页面,而是以f(doc)的概率到达每个页面,其中f(doc)对于新页面更高,并且Sigma(f(doc)) = 1 [对于集合中的所有文档,因此您的随机组件将为[f(doc1),f(doc2),...,f(docn)]
请注意,对于每个文档,必须满足f(doc)>0,否则无法保证收敛性[Perron-Frobenius定理不适用]。
另一个可能性是计算常规页面排名,并将其与不同的函数 g:Collection->R 相乘,该函数为每个页面赋予数值,而且页面越新,此文档的分数就越高。
编辑: 回应原问题的编辑: 当生成网络图时,添加额外信息 w:E->[0,1],意思是为每个边添加权重函数,表示其重要程度。如果链接是在最初编辑后不久建立的,则 w(e) 将更接近于 1,如果晚得多,则分数将更接近于 0。 在创建矩阵时,您需要计算页面排名,并使用 Matrix[v1][v2] <- w((v1,v2)) ,而不是简单的二进制值来指示边存在于图中。一旦您拥有了这个矩阵,就可以正常地计算页面排名。

抱歉我现在正在阅读论文并尝试理解它,这对于新编辑的问题仍然相关吗? - user956400
@user956400:看看我的编辑:我认为它可能更适合你修改后的问题。 - amit
听起来很容易,我没有意识到页面排名可以用于非二进制数据。 - user956400
不错的回答,尽管初读似乎暗示PageRank是使用随机游走计算的,但事实并非如此。 - Nick Johnson

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接