18得票4回答
SOLR和自然语言解析 - 我可以使用它吗?

需求 自然语言处理中的词频算法 使用 Solr 虽然那个问题的回答非常好,但我想知道我是否可以利用我花费的所有时间了解 SOLR 来进行 NLP。 我考虑使用 SOLR 的原因是: 它有许多标记器并执行大量的 NLP。 开箱即用,相当容易使用。 它是一个 RESTful 分布式应用...

18得票3回答
Firebase中如何处理大量数据用于推荐系统

我正在构建一个推荐系统,在其中使用Firebase存储和检索有关电影和用户偏好的数据。 每部电影都可以具有几个属性,数据如下所示:{ "titanic": {"1997": 1, "english": 1, "dicaprio": 1, "romance": 1, ...

17得票4回答
为什么Netflix奖项如此具有挑战性?

刚刚阅读了Wired最近的一篇文章,我很好奇:Netflix Prize有什么难度?我的意思是以最真诚的方式提问,只是想了解比赛所面临的困难。推荐引擎普遍都这么难以改进吗?如果是这样,为什么会这样?或者说,Netflix是否特别难以改进,如果是这样,Netflix有什么特别之处,使得这比Ama...

17得票3回答
Python/Django适用的好的协同过滤/匹配/推荐库是什么?

我正在寻找一个库,可以根据用户回答的问题以及自己的Django模型将我的用户与其他Django模型匹配。 所以我希望找到一个可定制性高、文档/支持优秀且实现不太困难的解决方案。 有没有什么好的推荐?我已经查看了Crab和Django-recommender,但它们似乎都没有很好的文档说明。...

17得票4回答
如何实现推荐引擎?

请谅解我的英语不是很熟练。 作为一名程序员,我想要学习推荐系统或相关的系统实现下面的算法或机器学习技术。例如,最显而易见的例子就是亚马逊。他们有一个非常好的推荐系统。他们了解:如果你喜欢这个,你可能也会喜欢那个,或者其他类似的东西:多少人喜欢同时购买这个和那个。 当然,我知道亚马逊是一个大...

15得票2回答
Lightfm: 处理用户和物品冷启动

我记得lightfm的一个优点是其模型不会遇到冷启动问题,包括用户和物品的冷启动:lightfm原始论文然而,我仍然不理解如何使用lightfm来解决冷启动问题。我使用用户-物品交互数据对模型进行了训练。据我所知,我只能对在我的数据集中存在的profile_ids进行预测。def predic...

15得票2回答
从API获取Google Analytics的“访客流量”数据

我正在尝试从Google Analytics收集信息,以构建我的网站的推荐引擎。该网站由许多页面组成,因此我正在跟踪用户点击次数,例如,从页面A到页面B的次数。目前,我可以通过previousPagePath = '/A'和nextPagePath = '/B'在Google Analytic...

14得票3回答
没有评分的推荐引擎

我发现有很多关于在imdb数据上构建推荐引擎的文章,这些文章可以在Towards Data Science/ medium/等网站上找到(基于用户对电影的评分,我们应该向这些用户推荐哪些电影)。这些文章从“基于用户内容过滤”和“基于物品内容过滤”的“基于记忆”的方法开始。我被要求制作一个推荐引...

13得票4回答
如果用户ID不是连续的整数而是字符串,如何使用mllib.recommendation?

我想使用Spark的mllib.recommendation库来构建一个原型推荐系统。但是,我拥有的用户数据格式如下:AB123XY45678 CD234WZ12345 EF345OOO1234 GH456XY98765 .... 如果我想使用mllib.recommendation库,根据R...

13得票1回答
Python中Surprise库出现"DatasetAutoFolds"对象没有"global_mean"属性的错误。

我正在使用surprise进行交叉验证def cross_v(data, folds=5): algorithms = (SVD, KNNBasic, KNNWithMeans, NormalPredictor) measures = ['RMSE', 'MAE'] for ...