Java语言编写的Mahout旨在构建可扩展的机器学习库。Python中是否有类似的库?
强烈推荐使用Scikits Learn http://scikit-learn.sourceforge.net/
Spark MLlib被推荐使用。它是可扩展的机器学习库,可以从HDFS读取数据,并且当然可以在Spark平台上运行。
您可以通过PySpark访问它(请参见编程指南中的Python示例)。
pysuggest是SUGGEST的Python封装,它是一个Top-N推荐引擎,实现了多种协同过滤推荐算法。
从我听到的消息来看,Orange据说相当不错,但我个人从未使用过。PyML 也值得一看。此外,Monte。
一个有趣的库是crab。
截至本篇文章,该库仅具有协同过滤算法的稳定实现:基于用户和基于项目。
包括SVD实现,但它是实验性的,基于内容的算法在路线图上。
一定要去看看!