我有两个数据集,其中包含两个连续变量:duration(持续时间)和waiting(等待时间)。
对于每个数据集,我会输出一个二维密度图。
我现在想要制作一个图表,显示两个图表具有相同密度的区域(白色),负差异(从白色到蓝色渐变,其中
如何计算和绘制密度的差异?
library("MASS")
data(geyser)
geyser1 <- geyser[1:150,]
geyser2 <- geyser[151:299,]
geyser2$duration <- geyser2$duration - 1
geyser2$waiting <- geyser2$waiting - 20
对于每个数据集,我会输出一个二维密度图。
ggplot(geyser1, aes(x = duration, y = waiting)) +
xlim(0.5, 6) + ylim(40, 110) +
stat_density2d(aes(alpha=..level..),
geom="polygon", bins = 10)
ggplot(geyser2, aes(x = duration, y = waiting)) +
xlim(0.5, 6) + ylim(40, 110) +
stat_density2d(aes(alpha=..level..),
geom="polygon", bins = 10)
我现在想要制作一个图表,显示两个图表具有相同密度的区域(白色),负差异(从白色到蓝色渐变,其中
geyser2
比geyser1
密集)和正差异(从白色到红色渐变,其中geyser1
比geyser2
密集)。如何计算和绘制密度的差异?