用ggplot2绘制决策边界?

11

我该如何使用ggplot2绘制与contour(基本R)等效的图表?以下是使用线性判别函数分析的示例:

require(MASS)
iris.lda<-lda(Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data =    iris)
datPred<-data.frame(Species=predict(iris.lda)$class,predict(iris.lda)$x) #create data.frame

#Base R plot
eqscplot(datPred[,2],datPred[,3],pch=as.double(datPred[,1]),col=as.double(datPred[,1])+1) 

#Create decision boundaries
iris.lda2 <- lda(datPred[,2:3], datPred[,1])
x <- seq(min(datPred[,2]), max(datPred[,2]), length.out=30)
y <- seq(min(datPred[,3]), max(datPred[,3]), length.out=30)
Xcon <- matrix(c(rep(x,length(y)),
             rep(y, rep(length(x), length(y)))),,2) #Set all possible pairs of x and y  on a grid

iris.pr1 <- predict(iris.lda2, Xcon)$post[, c("setosa","versicolor")] %*% c(1,1)    #posterior probabilities of a point belonging to each class 
contour(x, y, matrix(iris.pr1, length(x), length(y)), 
    levels=0.5, add=T, lty=3,method="simple") #Plot contour lines in the base R plot
iris.pr2 <- predict(iris.lda2, Xcon)$post[, c("virginica","setosa")] %*% c(1,1)
contour(x, y, matrix(iris.pr2, length(x), length(y)), 
    levels=0.5, add=T, lty=3,method="simple") 

#Eqivalent plot with ggplot2 but without decision boundaries
ggplot(datPred, aes(x=LD1, y=LD2, col=Species) ) + 
geom_point(size = 3, aes(pch = Species))

在使用ggplot绘制等高线时,无法使用矩阵。可以使用melt将矩阵重组为数据框。下面的数据框显示了来自iris.pr1的概率值在第一列中,并且x和y坐标在接下来的两列中显示。x和y坐标形成了一个30 x 30点的网格。

df <- transform(melt(matrix(iris.pr1, length(x), length(y))), x=x[X1], y=y[X2])[,-c(1,2)]

我希望绘制坐标点(最好用平滑曲线连接),其中后验概率为0.5(即决策边界)。
2个回答

11

您可以在ggplot中使用geom_contour实现类似的效果。正如您所猜测的那样,您确实需要转换您的数据。我最终只是这样做了

pr<-data.frame(x=rep(x, length(y)), y=rep(y, each=length(x)), 
    z1=as.vector(iris.pr1), z2=as.vector(iris.pr2))

然后,您可以将该data.frame传递给geom_contour,并指定希望在0.5处断开。

ggplot(datPred, aes(x=LD1, y=LD2) ) + 
    geom_point(size = 3, aes(pch = Species,  col=Species)) + 
    geom_contour(data=pr, aes(x=x, y=y, z=z1), breaks=c(0,.5)) + 
    geom_contour(data=pr, aes(x=x, y=y, z=z2), breaks=c(0,.5))

而这就提供了:

带有概率轮廓边界的ggplot


要画一条线,我们必须通过轮廓图吗?没有其他方法可以使用geom_line吗? - user3236841

0

klaR库中的partimat函数可以对观察到的预测变量进行操作,但如果您想对LDA投影进行相同的操作,则可以构建一个数据框,将原始数据与LD1...LDk投影相结合,然后使用公式Group〜LD1+...+LDk,method ='lda'调用partimat - 然后您可以看到您想要看到的“LD平面”,并为您进行了良好的分区。 对我来说,这似乎更容易解释给新手学习R的学生,因为我只是以一种不太打算的方式重复使用已经提供的函数。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接