考虑一个拥有1000万个产品的电商网站MySQL
我正在尝试设置一个分类模块来对产品进行分类。我使用Apache Sqoop将数据从MySQL导入到Hadoop。
我想使用Mahout作为机器学习框架之一,使用其Classification algorithms之一,然后遇到了配备MLlib的Spark。
那么这两个框架有什么区别呢?
主要是它们各自的优点、缺点和限制是什么?
products
数据库。我正在尝试设置一个分类模块来对产品进行分类。我使用Apache Sqoop将数据从MySQL导入到Hadoop。
我想使用Mahout作为机器学习框架之一,使用其Classification algorithms之一,然后遇到了配备MLlib的Spark。
那么这两个框架有什么区别呢?
主要是它们各自的优点、缺点和限制是什么?