基于列值的行总和

Question

基于列值的行总和

35

我想对具有同一列中相同值的行进行求和：

> df <- data.frame("1"=c("a","b","a","c","c"), "2"=c(1,5,3,6,2), "3"=c(3,3,4,5,2))
> df
  X1 X2 X3
1  a  1  3
2  b  5  3
3  a  3  4
4  c  6  5
5  c  2  2

对于一列（X2），数据可以聚合以获得具有相同X1值的所有行的总和：

> ddply(df, .(X1), summarise, X2=sum(X2))
  X1 X2
1  a  4
2  b  5
3  c  8

我该如何对X3和任意数量的其他列执行相同的操作，但不包括X1？

这是我想要的结果：

- R-obert

4个回答

25

"

aggregate可以使用公式界面轻松完成此操作：

"

aggregate(. ~ X1, data=df, FUN=sum)
##   X1 X2 X3
## 1  a  4  7
## 2  b  5  3
## 3  c  8  7

等价于：

aggregate(cbind(X2, X3) ~ X1, data=df, FUN=sum)

- Matthew Lundberg

6

aggregate 函数非常适合这类事情：

aggregate(df[,-1],df["X1"],sum)

  X1 X2 X3
1  a  4  7
2  b  5  3
3  c  8  7

以下是基于R语言中plyr包的numcolwise方法的基础版本：

aggregate(df[,sapply(df,is.numeric)],df["X1"],sum)

- thelatemail

5

一个用于内存效率和代码优雅的data.table解决方案

library(data.table)
DT <- data.table(df)


DT[, lapply(.SD, sum), by = X1]

.SD是data.table中根据X1的值定义的每个组的数据子集。与data.table包相关联的有3个有用的小贴士。

- mnel

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ista · Accepted Answer

ddply(df, "X1", numcolwise(sum))

请参见 ?numcolwise 以获取详情和示例。