编辑:输入
我对这个非常新。
我有一个类似于这个问题: 按组计数丢失变量?
从那个问题中获取输入数据:
df1 <- data.frame(
Z = sample(LETTERS[1:5], size = 10000, replace = T),
X1 = sample(c(1:10,NA), 10000, replace = T),
X2 = sample(c(1:25,NA), 10000, replace = T),
X3 = sample(c(1:5,NA), 10000, replace = T))
正如一位用户所提出的,可以使用summarise_each
函数:
df1 %>%
group_by(Z) %>%
summarise_each(funs(sum(is.na(.))))
#Source: local data frame [5 x 4]
#
# Z X1 X2 X3
# (fctr) (int) (int) (int)
#1 A 169 77 334
#2 B 170 77 316
#3 C 159 78 348
#4 D 181 79 326
#5 E 174 69 341
然而,我只想获得每个组中缺失值的总数。
我也尝试过这个方法,但它没有起作用:R按组计算NA 理想情况下,它应该给我类似这样的结果:
# Z sumNA
# (fctr) (int)
#1 A 580
#2 B 493
#3 C 585
#4 D 586
#5 E 584
提前感谢。
dput(df)
的输出结果。如果太大,请使用dput(head(df, 20))
的输出结果。(df
是您的数据集名称。) - Rui Barradasgroup_by(df1, Z) %>% summarize(n = sum(is.na(X1)))
?这些数字与您在此处展示的数字不同,但这可能是由于未受控制的随机性(应该使用set.seed
)。 - r2evans