我需要用R计算一个大型数据集的所有列的平均值,按照两个变量进行分组。
让我们用mtcars测试一下:
library(dplyr)
g_mtcars <- group_by(mtcars, cyl, gear)
summarise(g_mtcars, mean (hp))
# Source: local data frame [8 x 3]
# Groups: cyl [?]
#
# cyl gear `mean(hp)`
# <dbl> <dbl> <dbl>
# 1 4 3 97.0000
# 2 4 4 76.0000
# 3 4 5 102.0000
# 4 6 3 107.5000
# 5 6 4 116.5000
# 6 6 5 175.0000
# 7 8 3 194.1667
# 8 8 5 299.5000
它适用于"hp",但我需要获取mtcars的每一列(除了“cyl”和“gear”组成的组)的平均值。数据集很大,有几列。手动输入,例如: summarise(g_mtcars, mean(hp), mean(drat), mean(wt),...)
不切实际。
group_by
函数的包?请确保示例是可重现的。 - Bhasdplyr
包,这应该在帖子中提到。我已经编辑了它。 - RHertel