我正在尝试在运行Windows的应用程序中使用Mahout。我想使用k-means从lucene索引构建集群。
但是,一旦我需要创建序列文件(从lucene索引创建向量),由于Hadoop在Windows环境中调用未知程序(例如chmod),我就会遇到Hadoop异常。在Cygwin中运行不是一个选项,因为我希望能够从eclipse运行该应用程序。
因此,我的问题是:是否有一种方法可以避免创建序列文件来从lucene索引中检索向量?
或者是否有一种在Windows环境中创建序列文件的方法?
但是,一旦我需要创建序列文件(从lucene索引创建向量),由于Hadoop在Windows环境中调用未知程序(例如chmod),我就会遇到Hadoop异常。在Cygwin中运行不是一个选项,因为我希望能够从eclipse运行该应用程序。
因此,我的问题是: