我正在设计一个网站,围绕着基于用户口味推荐各种物品的概念建立。(例如他们评价过的物品、添加到收藏夹中的物品等) 其中一些例子是亚马逊、Movielens和Netflix。 现在,我的问题是,我不确定从数学角度来看该系统应该从哪里开始。我愿意学习所需的数学知识,只是我不知道需要哪种类型的数学知...
Mahout中支持使用API方法进行基于物品的推荐: ItemBasedRecommender.mostSimilarItems(int productid, int maxResults, Rescorer rescorer) 然而在Spark Mllib中,ALS的API似乎可以获取...
在过去的几天里,我一直在使用Mahout尝试创建一个推荐引擎。我正在处理以下数据: 12M个用户 2M个项目 18M个用户-项目布尔推荐 现在我正在对我们拥有的全部数据集的1/3进行实验(即从18M个推荐中选取了6M个)。无论我尝试哪种配置,Mahout提供的结果都相当令人失望。有些推荐需要...
我有一本《集体智慧》的书,但我不确定如何将其应用于实践中。 假设我有一个PHP网站和一个mySQL数据库。用户可以在数据库中插入带有标题和内容的文章。为了简单起见,我们只比较标题。 如何制作咖啡? 关于咖啡的15件事。 重要问题。 如何削铅笔? 男人被击中要害部位。 我们打开“如何制...
我计划实现一个推荐引擎,具体细节可以在这里找到。我首选使用'Python'和'neo4j'数据库。请问是否有人可以指出如何将'neo4j'与像'django'这样的Web框架集成?是否可以像'PHP'与'MySQL'集成一样进行集成?谢谢提前。 谢谢!
我一直在阅读关于使用矩阵分解进行协同过滤的文章,但我似乎找不到一个处理添加新用户或项目到系统中,或者用户对新项目进行评分的示例。在这些情况下,需要重新计算物品-用户矩阵和分解,是吗?如何在大量用户和物品的情况下保持良好的性能?有什么方法可以避免这种情况?谢谢。
我用Delphi创建了一个类似Winamp的音乐播放器。当然,不是很复杂,只是一个简单的播放器。 现在我想添加一个更复杂的功能:根据用户的听歌习惯自动对库中的歌曲进行评分。 这意味着应用程序应该“理解”用户是否喜欢一首歌曲,而且还要知道他/她喜欢程度的高低。 到目前为止,我的方法(可用的...
尝试使用Spark MLLib的ALS构建推荐系统。 目前,我们正在尝试每天预先为所有用户构建推荐。我们使用简单的隐式反馈和ALS。 问题在于,我们有2000万个用户和3000万个产品,并且要调用主要的predict()方法,需要对用户和产品进行笛卡尔积连接,这太大了,可能需要数日才能生成...
我正在使用LightFM推荐库处理我的数据集,它会给我返回下面图片中的结果。 NUM_THREADS = 4 NUM_COMPONENTS = 30 NUM_EPOCHS = 5 ITEM_ALPHA = 1e-6 LEARNING_RATE = 0.005 LEARNING_SCHED...