在R中可视化数据重叠的最佳方法

3
如果我有一组对象,其中一些共享某些离散属性(例如A、B、C、D设置为1或0),我该如何可视化数据集中这些属性的覆盖范围和重叠?
例如:
        id  A  B  C  D
    1   34  1  0  0  1
    2   56  1  1  1  1
    3   14  0  0  1  1
    4   90  0  0  1  0

我主要使用R语言,已经尝试了一些维恩图绘制包,但是在5个维度以上不太可扩展。

有没有其他更适合的可视化软件包?


1
一个“热力图”可能会起作用。 - James
1个回答

3

我的建议可能与您最初可视化数据集的目的不同,但这可能是一种方法:考虑可视化任意两个观测值(行)之间的成对距离。由于您有二进制数据,因此可以使用适合此数据类型的任何距离度量,例如,请参见题为“二进制相似性度量的调查”的论文。之后,您可以考虑基于计算出的距离度量进行聚类,以便您拥有从分层聚类结果常用的热图和其他可视化工具。


1
谢谢,这些给了我一些好的方向。我想也许可以类似于梯度下降的方法,但我不需要对模型进行预测,只需要折叠维度。从未尝试过热力图,应该是一个有趣的体验! - JoeKir
@JoeKir:不客气。一定要看一下gplots R包中的heatmap.2函数,它是R中heatmap函数的增强版。 - alittleboy

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接