将数据框绘制为R图以获得更有效的数据概述

4
在工作中,当我想要理解数据集(我处理寿险组合数据)时,通常会使用Excel中的数据透视表查看变量随时间的变化或变量之间的依赖关系。我在大学里学习了一个很好的R函数,可以像下面这样绘制数据帧中的每一列与其他列的关系:
对于issue.age和duration之间的依赖关系,这个图实际上非常有趣,因为你可以清楚地看到高出单年龄与短期保单期限相关(因为每个保单都有一个最高年龄)。然而,在涉及issue.year iss.year的情况下,这些图形要简单得多。事实上,你从它们身上什么也看不到。我想用一眼就能看到新发政策的平均年龄是否在2014年至2016年期间增加的方式,看看发行年龄的分布是否有所变化,类似于这样:
在这张图中,你可以立刻看到新发保单的平均年龄从2014年到2016年逐渐增加。我不想编写需要针对每个数据集进行自定义的代码,因为那样我也可以在Excel中更快地手动完成。所以我的问题是,是否存在一种简单的方法来绘制矩阵中的每一列与其他每一列之间的关系,而不仅仅是使用标准的plot(data.frame)函数提供的灵活图表类型?
1个回答

5
GGally库中的ggpairs()函数。它具有可视化各种类型列的很多能力,并提供了对可视化内容的很多控制。
例如,这里是上面链接的vignette中的一小段代码:
data(tips, package = "reshape")
ggpairs(tips)

ggpair example visualization


1
这真是太不可思议了,非常感谢。我知道一定有类似的东西! - Kolti

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接