pvclust
在 R 中用于聚类分析非常好。然而,在批量操作中运行它时,同样的数据会得到不同的结果,这很烦人。显然,对于同一组数据有许多“正确”的聚类方法,似乎 pvclust
使用某些随机性来确定特定运行的聚类。但是否有方法可以获得确定性的结果呢?
我希望能够呈现一个最小、可重复的分析包:数据加上一个 R 脚本,以及一个单独的书面文档,其中包含我的聚类解释。这样,其他人就可以添加分析,例如通过改变绘图的美学外观等方式。现在,当他们运行包含 pvclust
的脚本时,他们得到的解释将始终与我的解释不同步。