我想使用sklearn的k-means聚类函数对鸢尾花数据集进行分类(我去掉了标签,因此现在是无标签数据)。我已经制作了预测模型,输出似乎大部分情况下可以正确地对数据进行分类,但它随机选择标签(0、1和2),我无法将其与自己的标签进行比较以确定准确性(我已将setosa标记为0,versicolor标记为1,virginica标记为2)。有没有办法正确地标记这些花?以下是代码:
from sklearn.cluster import KMeans
cluster = KMeans(n_clusters = 3)
cluster.fit(features)
pred = cluster.labels_
score = round(accuracy_score(pred, name_val), 4)
print('Accuracy scored using k-means clustering: ', score)
特征,如预期所含,包含特征,name_val是包含花的值的矩阵,0表示setosa,1表示versicolor,2表示virginica。
编辑:我想到的一个解决方案是将random_state设置为任何数字,以便标记保持不变,还有其他解决方案吗?