假设我有一个按照两个因素分组的数据框。有没有一种方法可以使用dplyr
对数据组进行抽样?(注意:不是在组内进行抽样)
例如:
DF <- data.frame(A = rep(LETTERS[1:4], each = 6),
B = rep(c(1:2), 12),
C = rnorm(24))
# base r solution
DF$group_var <- paste(DF$A, DF$B, sep = "_")
DF_sample <- DF[DF$group_var %in% sample(unique(DF$group_var), 3), ]
#possible dplyr solution?
DF_sample <- DF %>% group_by(A,B) %>% sample_group_of_data(3)
DF %>% filter(group_var %in% sample(unique(DF$group_var), 3, replace = F))
不够 dplyr-oïd? - Vincent Bonhomme