39得票5回答
如何创建自己的推荐引擎?

最近我对推荐引擎很感兴趣,想在这个领域提高自己。我正在阅读 O'Reilly 出版社的《Programming Collective Intelligence》,我认为这是关于这个主题最好的书籍。但是我不知道如何实现引擎;我的意思是“不知道从哪里开始”。我脑海中有一个类似 Last.fm 的项...

29得票9回答
推荐系统是如何工作的?

我一直很好奇这些系统是如何工作的。例如,Netflix或亚马逊如何根据过去的购买记录和/或评级确定要推荐什么内容?是否有任何算法可供参考? 只是为了避免误解,我问这个问题并没有实际的理由。我只是出于纯粹的好奇心而问。 (另外,如果有关于这个主题的现有问题,请指引我。" 推荐系统" 是一个难...

28得票2回答
基于项目和基于内容的协同过滤有什么区别?

我对书籍《Mahout in Action》中所描述的基于物品的推荐算法感到困惑。书中有这个算法:for every item i that u has no preference for yet for every item j that u has a preference for ...

27得票2回答
使用机器学习进行数据去重

我有一个问题,想用机器学习来解决,但不确定它是否适用于我的用例。 我有一个包含约1亿条记录的数据集,其中包括客户数据,包括姓名、地址、电子邮件、电话等,希望找到一种清理客户数据并识别可能重复的数据的方法。 大部分数据是使用外部系统手动输入的,没有经过验证,因此我们的许多客户在我们的数据库中...

26得票7回答
只有正面和中性数据如何训练分类器?

我的问题:如何使用仅有的正面和中性数据来训练分类器? 我正在为教育目的构建个性化文章推荐系统,所用数据来自 Instapaper。 数据集: 我只有正面数据: - 我阅读并“喜欢”的文章,无论已读/未读状态如何 而中性数据(因为我表达了兴趣,但我可能不喜欢它)包括: - 未读文章 - 我...

24得票1回答
召回率、召回率@k和top-k推荐中的精确度

根据1、2和3中的作者所述,Recall是仓库中所有相关物品中被选出的相关物品的百分比,而Precision是查询所选出的相关物品中相关物品的百分比。 因此,假设用户U得到了一个前k个推荐物品的列表,则它们应该如下: Recall=(前k个推荐物品中的相关物品)/(所有相关物品) Pre...

21得票1回答
Understanding Precision@K, AP@K, MAP@K

我正在评估基于隐式反馈的推荐系统。关于排名任务的评估指标,我感到有些困惑,特别是我想通过精确率和召回率来进行评估。 在排名任务中,精确率@k的优点是不需要对相关文档集的大小进行估计,但缺点是它是常用评估指标中最不稳定的之一,并且它不能很好地进行平均,因为查询的相关文档总数对k值的精确率有很大...

19得票4回答
构建推荐引擎时需要考虑什么?

我读了《集体智慧编程》这本书,感觉很有意思。最近听说亚马逊向世界发起了一个挑战,要求设计更好的推荐引擎。 获胜者似乎通过限制输入信息的数量,提出了最佳算法。 通常而言,"对于模糊算法而言,拥有更多信息并不一定更好。"这是第一原则。 虽然这是一个主观问题,但最终还是可以通过推荐后的点击量来...

19得票1回答
如何评估基于内容的推荐系统

我正在构建一个基于内容的电影推荐系统。它很简单,只需让用户输入电影标题,系统将找到具有最相似特征的电影。 在计算相似度并按降序对分数进行排序后,我找到了5个最高相似度分数的相应电影并返回给用户。 一切都运作良好,直到我想要评估该系统的准确性为止。我在Google上找到的一些公式仅基于评分值...

19得票5回答
基于标签/关键词的推荐

我想知道在标签驱动的电商环境中使用什么算法比较聪明: 每个商品都有若干个标签。例如: 商品名称:"Metallica - Black Album CD",标签:"metallica", "black-album", "rock", "music" 每个用户都有一些标签和与之关联的朋友(其...