数据集是 Pandas 数据帧。这是 sklearn.cluster.KMeans。
km = KMeans(n_clusters = n_Clusters)
km.fit(dataset)
prediction = km.predict(dataset)
这是我决定哪个实体属于哪个群集的方式:
for i in range(len(prediction)):
cluster_fit_dict[dataset.index[i]] = prediction[i]
这是数据集的样子:
A 1 2 3 4 5 6
B 2 3 4 5 6 7
C 1 4 2 7 8 1
...
A、B、C为索引
这是使用k-means的正确方式吗?
df.values
或df.col.values
,所以基本上它应该可以工作,请尝试一下,如果遇到问题,请带上代码和数据再来问。 - EdChum