KMeans聚类用于超过500万个向量的情况

4

我遇到了一个真正的问题。我需要对包含大约32列的500万个向量进行一些Kmeans聚类。

我尝试了需要Linux系统的Mahout,但我使用的是Windows系统,因此无法使用Linux操作系统或任何模拟器。

有人能推荐一个可扩展到500万个向量且可以快速收敛的KMeans聚类算法吗?

我已经测试过一些算法,但它们无法扩展,这意味着它们很慢,需要很长时间才能完成。

谢谢


有多少个簇?欧氏距离还是自定义距离度量? - denis
1个回答

2

链接已经不正确了,但是你可以通过谷歌轻松找到这些指南。 - user334911
结束的括号应该是URL的一部分。您可以看到它目前没有突出显示为URL的一部分。在浏览器中将其添加到URL中,将会带您到该页面。 - user349026

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接