我已经花了一段时间来思考这个问题,但似乎找不到一个好的解决方案。我希望听听大家的想法(或者是否有现成的解决方案)。让我描述一下这个问题。
最终目标是在运行算法并排序结果后,在数据集中找到整体“最喜欢的颜色”。
假设我们允许用户投票选出自己最喜欢的颜色。例如,我们有蓝色、红色、绿色和黄色。我们让用户投票选择他们两种颜色中最喜欢的一种。(例如:红色胜过蓝色)
随着时间的推移,我们的数据可能会变成这样:(大括号内的数字表示该颜色获得的投票数)
- 红色(7)vs 蓝色(2) - 红色(6)vs 绿色(3) - 红色(3)vs 黄色(4) - 蓝色(3)vs 绿色(5) - 蓝色(4)vs 黄色(4) - 绿色(1)vs 黄色(5)
我认为我们需要为每个配对分配一个“置信度”分数,描述我们有多么确定结果是正确的。(也许是平局的0,如果我们100%确定,则为1)我想我们需要考虑每个配对的总投票数。例如,只有1票的配对和100%置信度分数需要进行“减弱”。
总之,如果有人有任何想法,我很乐意听取。谢谢阅读。
祝好!
最终目标是在运行算法并排序结果后,在数据集中找到整体“最喜欢的颜色”。
假设我们允许用户投票选出自己最喜欢的颜色。例如,我们有蓝色、红色、绿色和黄色。我们让用户投票选择他们两种颜色中最喜欢的一种。(例如:红色胜过蓝色)
随着时间的推移,我们的数据可能会变成这样:(大括号内的数字表示该颜色获得的投票数)
- 红色(7)vs 蓝色(2) - 红色(6)vs 绿色(3) - 红色(3)vs 黄色(4) - 蓝色(3)vs 绿色(5) - 蓝色(4)vs 黄色(4) - 绿色(1)vs 黄色(5)
我认为我们需要为每个配对分配一个“置信度”分数,描述我们有多么确定结果是正确的。(也许是平局的0,如果我们100%确定,则为1)我想我们需要考虑每个配对的总投票数。例如,只有1票的配对和100%置信度分数需要进行“减弱”。
总之,如果有人有任何想法,我很乐意听取。谢谢阅读。
祝好!