在ggtern中绘制kde结果

7

我正在使用ggtern绘制一个大型数据集的三元图(见下面的示例)。

enter image description here

在某种数据大小范围内,使用geom_density_tern()是完美的。由于我想可视化一个更复杂的数据集,加载所有数据并使用ggplot渲染已经不可能了(受限于内存)。我想也许可以通过分别计算kde2d矩阵的结果来绕过这个问题。但是我卡住了。我想知道是否有可能在ggtern中进行任何形式的解决?
无论如何,我会添加一个数据结构和绘图的最小案例,这是我目前使用的。
require(ggplot2)
require(ggtern) 

set.seed(1) 

mydata <- data.frame(
        x = runif(100, min = 0.25, max = 0.5),
        y = runif(100, min = 0.1, max = 0.4),
        z = runif(100, min = 0.5, max = 0.7))   

plot <- ggtern() + 
        theme_bw() +
        theme_hidetitles() +
        geom_density_tern(data = mydata,
            aes(x = x, y = y, z = z, alpha = ..level.. ), 
            size = 0.1, linetype = "solid", fill = "blue")+
        geom_point(data = mydata, 
            aes(x = x, y = y, z = z), alpha = 0.8, size = 1)
plot

这些额外的行在三元配位系统中重新生成密度图:
library(MASS)
dataTern = transform_tern_to_cart(mydata$x,mydata$y,mydata$z)
dataTernDensity <- kde2d(x=dataTern$x, y=dataTern$y, lims = c(range(0,1), range(0,1)), n = 400) 

image(dataTernDensity$x, dataTernDensity$y, dataTernDensity$z)
points(dataTern$x, dataTern$y, pch = 20, cex = 0.1)
segments(x0 = 0, y0 = 0, x1 = 0.5, y1 = 1, col= "white")
segments(x0 = 0, y0 = 0, x1 = 1, y1 = 0, col= "white")
segments(x0 = 0.5, y0 = 1, x1 = 1, y1 = 0, col= "white")

获取此图表:

enter image description here

提前感谢任何帮助!


我理解的是您可以调用 kde2,但在使用 ggtern + geom_density_tern 时会出现内存不足的情况,是这样吗? - tonytonov
我的意思是,在我的“真实”分析中,我有一个巨大的数据框,它远远超出了geom_density_tern一次处理的范围。我想在geom_density_tern中加载预计算的kde2矩阵。这样更容易理解吗? - Ludwik
1个回答

2
我们可以使用通常在统计学场景背后使用的代码来解决这个问题。刚刚发布了ggtern 2.0.1,在完全重写该包以与ggplot2 2.0.0兼容之后,它提供了一个可能适合您需求的方法。顺便说一下,您可以在这里找到ggtern 2.0.X新功能的摘要:
请查看以下针对您的问题的解决方案和可行代码,它能够在等积对数比空间上计算密度估计。 solution
#Required Libraries
library(ggtern)
library(ggplot2)
library(compositions)
library(MASS)
library(scales)

set.seed(1) #For Reproduceability
mydata <- data.frame(
  x = runif(100, min = 0.25, max = 0.5),
  y = runif(100, min = 0.1, max = 0.4),
  z = runif(100, min = 0.5, max = 0.7)) 

#VARIABLES
nlevels  = 7
npoints  = 200
expand   = 0.5

#Prepare the data, put on isometric logratio basis
df     = data.frame(acomp(mydata)); colnames(df) = colnames(mydata)
data   = data.frame(ilr(df)); colnames(data) = c('x','y')

#Prepare the Density Estimate Data
h.est  = c(MASS::bandwidth.nrd(data$x), MASS::bandwidth.nrd(data$y))
lims   = c(expand_range(range(data$x),expand),expand_range(range(data$y),expand))
dens   = MASS::kde2d(data$x,data$y,h=h.est,n=npoints,lims=lims)

#-------------------------------------------------------------
#<<<<< Presumably OP has data at this point, 
#      and so the following should achieve solution
#-------------------------------------------------------------

#Generate the contours via ggplot2's non-exported function
lines  = ggplot2:::contour_lines(data.frame(expand.grid(x = dens$x, y = dens$y),
                                            z=as.vector(dens$z),group=1),
                                 breaks=pretty(dens$z,n=nlevels))

#Transform back to ternary space
lines[,names(mydata)] = data.frame(ilrInv(lines[,names(data)]))

#Render the plot
ggtern(data=lines,aes(x,y,z)) +
  theme_dark() + 
  theme_legend_position('topleft') + 
  geom_polygon(aes(group=group,fill=level),colour='grey50') +
  scale_fill_gradient(low='green',high='red') + 
  labs(fill  = "Density",
       title = "Example Manual Contours from Density Estimate Data")

感谢您提供的解决方案。我添加了库(scales)行,因为没有它,expand_range()函数会丢失。 - Ludwik
数据绘图仍存在问题,但我会开启一个新的线程来解决。 - Ludwik
抱歉,我忘记包括比例尺了,我是从其他地方加载的。还有什么额外的问题? - Nicholas Hamilton

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接