在 ggplot2 中使用 facets 的 qqline

8

这个问题展示了如何在ggplot2中制作带有qqline的qq图,但答案似乎仅适用于在单个图中绘制整个数据集时。

我想要一种方法来快速比较我的数据子集的这些图。也就是说,我想在具有facet的图上制作带有qqlines的qq图。因此,在以下示例中,将为所有9个图绘制线条,每个图都有自己的截距和斜率。

df1 = data.frame(x = rnorm(1000, 10),
                 y = sample(LETTERS[1:3], 100, replace = TRUE),
                 z = sample(letters[1:3], 100, replace = TRUE))

ggplot(df1, aes(sample = x)) +
  stat_qq() +
  facet_grid(y ~ z)

facet data

2个回答

8
您可以尝试这个方法:
library(plyr)

# create some data
set.seed(123)
df1 <- data.frame(vals = rnorm(1000, 10),
                  y = sample(LETTERS[1:3], 1000, replace = TRUE),
                  z = sample(letters[1:3], 1000, replace = TRUE))

# calculate the normal theoretical quantiles per group
df2 <- ddply(.data = df1, .variables = .(y, z), function(dat){
             q <- qqnorm(dat$vals, plot = FALSE)
             dat$xq <- q$x
             dat
}
)

# plot the sample values against the theoretical quantiles
ggplot(data = df2, aes(x = xq, y = vals)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  xlab("Theoretical") +
  ylab("Sample") +
  facet_grid(y ~ z)

enter image description here


4

毫无理由,这里提供了相同功能的dplyr版本(在发出这个问题时还不存在)。为了进行同行评审和比较,我将提供生成数据集的代码,以便您进一步检查它们。

# create some data
set.seed(123)
df1 <- data.frame(vals = rnorm(10, 10),
                  y = sample(LETTERS[1:3], 1000, replace = TRUE),
                  z = sample(letters[1:3], 1000, replace = TRUE))

#* Henrik's plyr version
library(plyr)
df2 <- plyr::ddply(.data = df1, .variables = .(y, z), function(dat){
             q <- qqnorm(dat$vals, plot = FALSE)
             dat$xq <- q$x
             dat
}
)

detach("package:plyr")


#* The dplyr version
library(dplyr)
qqnorm_data <- function(x){
  Q <- as.data.frame(qqnorm(x, plot = FALSE))
  names(Q) <- c("xq", substitute(x))
  Q
}

df3 <- df1 %>%
  group_by(y, z) %>%
      do(with(., qqnorm_data(vals)))

绘图可以使用 Henrik 提供的相同代码完成。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接