在我们无所事事的时候,一个17岁的加拿大男孩似乎发现了一种信息检索算法,该算法具有以下特点:
a) 与当前广泛使用的向量空间模型相比,精度提高了两倍。
b) 在识别相似单词方面“相当准确”。
c) 使微搜索更加准确。
这里有一个很好的interview。
不幸的是,我找不到任何已经发布的论文,但是,从我几年前参加过的图形模型和机器学习课程中记得的片段中,我认为我们应该能够从他的提交摘要以及他在采访中说的话中重建它。
从采访中可以得知:
某些搜索会找到出现在类似上下文中的单词。这非常好,但这只是遵循第一层关系。我的算法试图进一步跟随连接。接近的连接被认为更有价值。在理论上,它可以无限地跟随连接。
而摘要则将其放入了上下文中:
介绍了一种名为“Apodora”的新型信息检索算法,使用类马尔可夫链矩阵的限制能力来确定文档模型,并对单词语义进行上下文统计推断。该系统已经实现并与向量空间模型进行比较。特别是在查询很短的情况下,新算法给出的结果精度大约是两倍,并且具有微搜索的有趣应用。对于了解马尔可夫链矩阵或信息检索的人来说,他们可能会立即意识到他正在做什么。
a) 与当前广泛使用的向量空间模型相比,精度提高了两倍。
b) 在识别相似单词方面“相当准确”。
c) 使微搜索更加准确。
这里有一个很好的interview。
不幸的是,我找不到任何已经发布的论文,但是,从我几年前参加过的图形模型和机器学习课程中记得的片段中,我认为我们应该能够从他的提交摘要以及他在采访中说的话中重建它。
从采访中可以得知:
某些搜索会找到出现在类似上下文中的单词。这非常好,但这只是遵循第一层关系。我的算法试图进一步跟随连接。接近的连接被认为更有价值。在理论上,它可以无限地跟随连接。
而摘要则将其放入了上下文中:
介绍了一种名为“Apodora”的新型信息检索算法,使用类马尔可夫链矩阵的限制能力来确定文档模型,并对单词语义进行上下文统计推断。该系统已经实现并与向量空间模型进行比较。特别是在查询很短的情况下,新算法给出的结果精度大约是两倍,并且具有微搜索的有趣应用。对于了解马尔可夫链矩阵或信息检索的人来说,他们可能会立即意识到他正在做什么。