我是一名对开发一个索引本国网页的搜索引擎感兴趣的学生。我已经研究了一段时间要使用的算法,并且已经确定HITS和PageRank是最好的选择。由于PageRank比HITS算法更加稳定(或者我读到的是这样的),所以我决定选择它。
我找到了无数与PageRank相关的文章和学术论文,但我的问题是,我不理解这些论文中构成该算法的大多数数学符号。具体来说,我不明白Google矩阵(即不可约、随机矩阵)是如何计算出来的。
我的理解基于以下两篇文章:
- http://online.redwoods.cc.ca.us/instruct/darnold/LAPROJ/fall2005/levicob/LinAlgPaperFinal2-Screen.pdf
- http://ilpubs.stanford.edu:8090/386/1/1999-31.pdf
有没有人能用较少的数学符号提供基本的解释(例子会很好)?
提前感谢。