Hadley向我介绍了plyr包,我发现自己经常使用它来进行“group by”类型的操作。但是我发现自己总是需要重命名生成的列,因为它们默认为V1、V2等。
这里有一个示例:
mydata<-data.frame(matrix(rnorm(144, mean=2, sd=2),72,2),c(rep("A",24),rep("B",24),rep("C",24)))
colnames(mydata) <- c("x_value", "acres", "state")
groupAcres <- ddply(mydata, c("state"), function(df)c(sum(df$acres)))
colnames(groupAcres) <- c("state","stateAcres")
有没有一种方法可以让ddply为我命名结果列,这样我就可以省略最后一行了?