众包排名的最佳匹配算法是什么?

6
我希望建立一个系统,众包选出一组最佳的10件物品,该组物品数量在20-2000之间(排名前十并不重要)。关于实际排序算法,stackoverflow有一篇非常好的文章,链接为如何使用众包排序对一百万张图片进行排名。我倾向于询问用户在两件物品中选择哪件更喜欢,并使用TrueSkill算法。
我的问题是,既然我正在使用类似于TrueSkill的东西,什么是决定向用户展示哪些物品对以获取最有价值信息以识别前10个物品的最佳算法?我将有一定机会询问人们他们最喜欢哪些物品,因此向用户展示的物品对对于识别前10名物品的系统提供最有价值的信息非常重要。同样,我的主要兴趣是找到前十名物品而不是其他物品彼此之间的排名,甚至也不是前十名物品彼此之间的排名。
2个回答

1

这个问题与组织一场淘汰赛非常相似,其中球员的技能不是很明显,而球员数量非常多(想象一下学校级别的网球比赛)。由于轮换赛(O(n ^ 2)场比赛)非常昂贵,但简单的淘汰赛又过于简单,通常的选择是采用k-淘汰结构。基本上,每个球员(在您的情况下是一个项目)在输掉k场比赛后就被淘汰出局。看看双败淘汰制:http://en.wikipedia.org/wiki/Double-elimination_tournament

也许您可以对其进行适当修改以满足您的需求。


1

另一个众所周知的算法是为Go或Chess锦标赛计算排名而设计的。您可以查看 MacMahon Algorithms,这些算法同时计算配对和排名。 我们可以截取这个算法,只产生一组最好的10个项目。

您可以在 Christian Gerlach的论文中找到更多详细信息,其中他描述了实际的优化算法(不幸的是,该论文是用德语写的)。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接