8得票1回答
HDBSCAN参数之间的区别

我对HDBSCAN中以下参数的区别感到困惑: 1. min_cluster_size 2. min_samples 3. cluster_selection_epsilon 请纠正我,如果我有误的话。 如果将min_samples设置为7,则形成的聚类需要具有7个或更多点。对于clust...

7得票1回答
在网络中生成不同的节点组

问题 给定以下节点和边的网络,我希望得出所有可能的节点分组,其中每个组内的所有节点都通过边与该组内的所有其他节点相连。 在这个网络中... 节点'B'、'C'和'F'将成为一组,因为它们之间完全互相连接。 'A'只能与自己形成一组。 'D'和'B'将组成一组,但是'D'不会和'B'...

9得票2回答
如何在R中进行聚类分析而不移除包含NA值的行。

我有一组数据,其中一些元素的值是NA。 我的目标是在不删除包含NA的行的情况下进行聚类。 我知道daisy中的gower距离测量可以允许这种情况。 但为什么我的下面的代码不起作用呢? 如果有其他替代方案,我也欢迎。 # plot heat map with dendogram togeth...

7得票5回答
如何通过接近度将对象分组到一个集合中?

我有一个包含数千个地址的集合。如果我可以获取每个地址的经纬度,如何按照接近程度将该集合分成组? 此外,我可能希望根据不同规则重新尝试“聚类”: N组 每组M个地址 组内任何地址之间的最大距离

9得票1回答
在进行双向聚类(行和列)后,如何在heatmap.2中添加ColSideColors?

我有以下的代码: library(gplots) library(RColorBrewer); setwd("~/Desktop") mydata <- mtcars hclustfunc <- function(x) hclust(x, method="complete") ...

14得票2回答
如何在R中的散点图上叠加饼图?

我想使用R替换2D散点图中的数据点,并显示附加值的饼图。 我的思路是,我有来自生物实验的数百个元素(蛋白质)的时间序列数据,监测了4种情况。 我想在y轴上绘制元素(分类数据),在x轴上绘制事件在时间上的发生。为了以饼图或甜甜圈图的形式可视化4个条件之间的相对出现率,我想将其覆盖到散点图中的相...

11得票3回答
在Matlab中查找具有高交叉相关矩阵的组

给定一个下三角矩阵(100x100),它包含交叉相关值,其中条目“ij”是信号“i”和“j”的相关值,因此高值意味着这两个信号属于相同的对象类别。已知数据集中最多有四个不同的类别,是否有一种快速有效的方法来对数据进行分类,并将所有信号分配到4个不同的类中,而不是搜索和交叉检查所有条目?以下7x...

33得票4回答
映射应用的聚类算法

我在研究对地图上的点(纬度/经度)进行聚类。有没有适合快速、可扩展的算法推荐? 更具体来说,我有一系列的纬度/经度坐标和一个地图视口。我想要聚类在一起的接近的点,以便去除杂乱。 我已经有一个解决方案(请参见此处),只是我想知道是否有任何正式的算法可以有效地解决这个问题。

37得票4回答
使用Levenshtein距离进行文本聚类

我有一组(2k - 4k)小字符串(3-6个字符),想要对它们进行聚类。由于使用了字符串,之前在如何进行聚类(特别是字符串聚类)中的答案告诉我,Levenshtein距离是用作字符串距离函数的好方法。而且,由于我事先不知道聚类的数量,层次聚类是正确的选择,而不是k-means。 尽管我理解了...

7得票2回答
如何在R中更改树形图标签

我在R中有一个树状图。它基于使用hclust进行的分层聚类。我正在使用不同的颜色着色不同的标签,但是当我尝试更改我的树状图的标签(为集群所基于的数据框的行)时,使用dendrogram = dendrogram %>% set("labels", dataframe$column),标签...