我在尝试对一个非常大且稀疏的矩阵(约500000行x4000列)进行一些(k-means)聚类。每行只有几个“1”值。我想得到大约2000组聚类。
我有两个问题: - 有人可以推荐一个开源平台或工具来完成这个任务(也许使用k-means,也许使用更好的算法)吗? - 我如何最好地估计算法需要完成的时间?我曾经试过使用weka,但在几天后中止了作业,因为我无法确定它需要多长时间。
谢谢!
我有两个问题: - 有人可以推荐一个开源平台或工具来完成这个任务(也许使用k-means,也许使用更好的算法)吗? - 我如何最好地估计算法需要完成的时间?我曾经试过使用weka,但在几天后中止了作业,因为我无法确定它需要多长时间。
谢谢!