我有一个物品-物品矩阵(1877 x 1877)。矩阵中的值表示两个物品一起出现的次数。如何确定两个物品之间的相似性?
经过阅读,我发现了几个选项。但是我不确定这些方法是否正确。任何有关开始的建议都会很受欢迎。
1.使用余弦计算两个向量之间的相似度 2.将此转换为图形,并使用类似simrank的度量来计算相似性-可以使用出现次数作为两个节点之间的权重。
1.使用余弦计算两个向量之间的相似度 2.将此转换为图形,并使用类似simrank的度量来计算相似性-可以使用出现次数作为两个节点之间的权重。
NearestNeighbors
来查找最接近的一个。有许多可用的度量标准。