我经常使用ddply,但并不认为自己是专家。我有一个包含分组变量“Group”的数据框(df),其值为“A”、“B”和“C”,以及要汇总的变量“Var”具有数值。如果我使用
ddply(df, .(Group), summarize, mysum=sum(Var))
然后我获得了每个A、B和C的总和,这是正确的。但我想做的是对数据框中按照Group变量排列的每个组进行求和。例如,如果数据框包含
Group Var
A 1.3
A 1.2
A 0.4
B 0.3
B 1.3
C 1.5
C 1.7
C 1.9
A 2.1
A 2.4
B 6.7
所期望的结果
A 2.9
B 1.6
C 5.1
A 4.5
B 6.7
所以,所期望的输出对于每个Group变量的分组执行数学函数,而不是在单个Group变量的所有实例上执行。在ddply中是否可以实现?数据
dat <- structure(list(Group = c("A", "A", "A", "B", "B", "C", "C", "C", "A", "A", "B"),
Var = c(1.3, 1.2, 0.4, 0.3, 1.3, 1.5, 1.7, 1.9, 2.1, 2.4, 6.7)),
.Names = c("Group", "Var"), class = "data.frame", row.names = c(NA, -11L))