我正在尝试对一个非常大的矩阵进行k-means聚类。
该矩阵大约有500000行x4000列,但非常稀疏(每行只有几个“1”值)。
整个矩阵无法全部载入内存,因此我将其转换为稀疏的ARFF文件。但是R无法读取稀疏的ARFF文件格式。我也有该数据的普通CSV文件。
在R中是否有可用于高效加载此类稀疏矩阵的软件包?然后,我将使用集群包中的常规k-means算法继续进行。
非常感谢。
该矩阵大约有500000行x4000列,但非常稀疏(每行只有几个“1”值)。
整个矩阵无法全部载入内存,因此我将其转换为稀疏的ARFF文件。但是R无法读取稀疏的ARFF文件格式。我也有该数据的普通CSV文件。
在R中是否有可用于高效加载此类稀疏矩阵的软件包?然后,我将使用集群包中的常规k-means算法继续进行。
非常感谢。