我知道这一定很简单,但我找不到正确的dplyr命令来完成这个任务。假设我想按两个变量对数据集进行分组,然后总结每行的计数。我们可以使用以下代码:
mtcars %>% group_by(cyl, mpg) %>% summarize(Count = n())
这将生成一个数据框,包含三个变量、mpg和Count的27行。接下来我想做的是汇总每个三个cyl值的平均mpg
,请注意每行可能包含一个大于1的Count
,在计算平均值时必须考虑它。我的数据框应该有3行2列的cyl和Avg_mpg。请问是否有人可以给我提供短代码块来完成此操作?
非常感谢。
mutate(Count = n())
而不是summarize(Count = n())
,这样权重列Count
将在计算加权平均值之前添加到所有行中。否则,结果与仅按cyl
分组的平均值完全相同。 - neilfws