我在这里看到了一些机器学习的问题,所以我想发布一个相关的问题:
假设我有一个数据集,其中运动员参加10公里和20公里的山地赛跑比赛,每个比赛都有自己的难度。用户的完成时间对于每个比赛几乎是反向正态分布的。
我们可以将这个问题写成一个矩阵:
我希望能够填写上述大小为1000x20且稀疏度为8%的矩阵。
由于我可以计算每个用户(能力)和每场比赛(mu、lambda分布)的参数,而且比赛之间的相关性非常高,因此应该有一种非常简单的方法来完成这个矩阵。
我可以利用排名User1 < User2 < User3和Item3 << Item2 < Item1的优势。
您是否可以给我一些提示我可以使用哪些方法?
假设我有一个数据集,其中运动员参加10公里和20公里的山地赛跑比赛,每个比赛都有自己的难度。用户的完成时间对于每个比赛几乎是反向正态分布的。
我们可以将这个问题写成一个矩阵:
Comp1 Comp2 Comp3
User1 20min ?? 10min
User2 25min 20min 12min
User3 30min 25min ??
User4 30min ?? ??
我希望能够填写上述大小为1000x20且稀疏度为8%的矩阵。
由于我可以计算每个用户(能力)和每场比赛(mu、lambda分布)的参数,而且比赛之间的相关性非常高,因此应该有一种非常简单的方法来完成这个矩阵。
我可以利用排名User1 < User2 < User3和Item3 << Item2 < Item1的优势。
您是否可以给我一些提示我可以使用哪些方法?