Python、Hadoop或其他平台上的图聚类

3

有没有人知道在Python中是否有一个可以选择大型无向图(100,000个节点和大量边缘)中的一些簇的程序包,以最小化簇内平方距离和类似的东西?我现在正在看MCL:http://micans.org/mcl/


10万个节点并不算太大。即使是完全图,邻接矩阵也只需要4*100000^2字节=37.252903千兆字节(假设边权可以存储在单精度中),这可以在单个EC2实例上完成。Hadoop过于复杂了,你尝试过在networkx中简单地完成吗? - dranxo
可能有些过度了。我在Networkx中没有看到任何可以给我节点聚类的东西,除了团以外。如果可以的话,我想做谱聚类,但似乎只有谱二分法可以返回某种常数。再看一眼,networkx可以给我拉普拉斯矩阵的特征值,所以也许我可以用它来执行谱聚类。 - rfoley
1个回答

1

看起来使用Mahout的谱聚类或者MCL算法都可以解决这个问题。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接