7得票2回答
皮尔逊相关系数在完全相关的数据集中失效。

考虑用户A和B对电影评分的数据集,以下是Pearson相关系数的几个示例: A = [2,4,4,4,4] B = [5,4,4,4,4] pearson(A,B) = -1 A = [5,5,5,5,5] B = [5,5,5,5,5] pearson(A,B) = NaN Pear...

10得票7回答
“顾客也购买了”需要在数据库中存储哪些信息?涉及IT技术。

亚马逊有"顾客还买了"。 我想知道并想将其添加到我的购物车中。 我需要在数据库中添加哪些字段? 有没有任何网站,博客或资源可以提供帮助? 您能否建议我应该如何编写代码的机制?

7得票1回答
加权斜率一算法?(从Python移植到R)

我正在阅读有关加权斜坡一算法的内容(更正式地说,请参见此处(PDF)),该算法应该从不同用户获取项目评级,并给定包含至少1个评级和1个缺失值的用户向量,预测缺失的评级。 我发现了一个Python实现的算法,但是我很难将其移植到R(我更熟悉它)。以下是我的尝试。有什么建议可以让它工作吗? 提...

11得票4回答
多键多值非确定性Python字典

Python已经有多键字典和多值字典。我需要一个既能实现多键又能实现多值的Python字典。 例子: # probabilistically fetch any one of baloon, toy or car d['red','blue','green']== "baloon" or ...

18得票3回答
Firebase中如何处理大量数据用于推荐系统

我正在构建一个推荐系统,在其中使用Firebase存储和检索有关电影和用户偏好的数据。 每部电影都可以具有几个属性,数据如下所示:{ "titanic": {"1997": 1, "english": 1, "dicaprio": 1, "romance": 1, ...

39得票5回答
如何创建自己的推荐引擎?

最近我对推荐引擎很感兴趣,想在这个领域提高自己。我正在阅读 O'Reilly 出版社的《Programming Collective Intelligence》,我认为这是关于这个主题最好的书籍。但是我不知道如何实现引擎;我的意思是“不知道从哪里开始”。我脑海中有一个类似 Last.fm 的项...

24得票1回答
召回率、召回率@k和top-k推荐中的精确度

根据1、2和3中的作者所述,Recall是仓库中所有相关物品中被选出的相关物品的百分比,而Precision是查询所选出的相关物品中相关物品的百分比。 因此,假设用户U得到了一个前k个推荐物品的列表,则它们应该如下: Recall=(前k个推荐物品中的相关物品)/(所有相关物品) Pre...

15得票2回答
Lightfm: 处理用户和物品冷启动

我记得lightfm的一个优点是其模型不会遇到冷启动问题,包括用户和物品的冷启动:lightfm原始论文然而,我仍然不理解如何使用lightfm来解决冷启动问题。我使用用户-物品交互数据对模型进行了训练。据我所知,我只能对在我的数据集中存在的profile_ids进行预测。def predic...

19得票1回答
如何评估基于内容的推荐系统

我正在构建一个基于内容的电影推荐系统。它很简单,只需让用户输入电影标题,系统将找到具有最相似特征的电影。 在计算相似度并按降序对分数进行排序后,我找到了5个最高相似度分数的相应电影并返回给用户。 一切都运作良好,直到我想要评估该系统的准确性为止。我在Google上找到的一些公式仅基于评分值...

9得票2回答
使用包含新标签的数据附加具有MultiIndex的pandas DataFrame,但保留旧MultiIndex的整数位置。

基本情景 我正在为一个推荐服务训练一个矩阵分解模型(LightFM),该模型使用一组用户-项目交互数据。为了使矩阵分解模型产生最佳结果,我需要将我的用户和项目ID映射到以0开始的连续整数ID范围内。 我在这个过程中使用了pandas DataFrame,并发现MultiIndex非常方便来...