我正在使用scipy.cluster.hierarchy.linkage作为聚类算法,并将结果链接矩阵传递给 scipy.cluster.hierarchy.fcluster,以获取各种阈值的扁平化聚类。
我想计算结果的Silhouette分数并将它们与其他结果进行比较,以选择最佳的阈值。我希望不用自己实现,而是使用scikit-learn的 sklearn.metrics.silhouette_score。
如何重新排列我的聚类结果以作为sklearn.metrics.silhouette_score的输入?
我想计算结果的Silhouette分数并将它们与其他结果进行比较,以选择最佳的阈值。我希望不用自己实现,而是使用scikit-learn的 sklearn.metrics.silhouette_score。
如何重新排列我的聚类结果以作为sklearn.metrics.silhouette_score的输入?
distmatrix + distmatrix.T
部分只是你的 X(用于生成列的特征),而nodes
则是你的 y(聚类的标签)。你可以直接从你的数据框中引用它们,而不是作为单独的对象。 - WJTownsend