我想使用ggplot2来说明两个类似密度分布之间的差异。这是一个我所拥有数据类型的玩具示例:
library(ggplot2)
# Make toy data
n_sp <- 100000
n_dup <- 50000
D <- data.frame(
event=c(rep("sp", n_sp), rep("dup", n_dup) ),
q=c(rnorm(n_sp, mean=2.0), rnorm(n_dup, mean=2.1))
)
# Standard density plot
ggplot( D, aes( x=q, y=..density.., col=event ) ) +
geom_freqpoly()
与其分别为每个类别(
dup
和 sp
)绘制密度图,如上所示,我该如何绘制一条单独的线来显示这些分布之间的差异?在上面的玩具示例中,如果我从
sp
密度分布中减去dup
密度分布,则结果线将在绘图左侧上方(因为较小的sp
值很多)并在右侧下方(因为较大的dup
值很多)。请注意,类型dup
和sp
的观察数量可能不同。更一般地说,展示类似密度分布之间的差异的最佳方法是什么?