以下是几种不使用包的解决方案:
1) tapply 这种方法不需要使用任何包。 它生成一个带有空单元格NA值的 "matrix" 输出:
tapply(DF$SLP, DF[c("year", "site")], mean)
提供:
site
year 1 2 3
2005 6.0 NA NA
2006 NA 4.966667 NA
2007 NA NA 9.5
2008 8.6 NA 5.1
2009 NA 6.100000 NA
2) aggregate/xtabs 使用 aggregate
+ xtabs
。这将创建一个类为 c("xtabs", "table")
的对象,并对空单元格设置为零值:
fo <- SLP ~ year + site
xtabs(fo, aggregate(fo, DF, mean))
给予;
site
year 1 2 3
2005 6.000000 0.000000 0.000000
2006 0.000000 4.966667 0.000000
2007 0.000000 0.000000 9.500000
2008 8.600000 0.000000 5.100000
2009 0.000000 6.100000 0.000000
3) 聚合/重塑 这也使用了aggregate
,但是使用了reshape
而不是xtabs
。它生成一个带有空单元格NA的数据框r
。最后一行使列名与之前的解决方案保持一致,如果这不重要,则可以省略。
ag <- aggregate(SLP ~ site + year, DF, mean)
r <- reshape(ag, dir = "wide", idvar = "year", timevar = "site")
names(r) <- sub(".*[.]", "", names(r))
提供:
> r
year 1 2 3
1 2005 6.0 NA NA
3 2006 NA 4.966667 NA
5 2007 NA NA 9.5
2 2008 8.6 NA 5.1
4 2009 NA 6.100000 NA
注意:所使用的可重现形式中的输入DF
为:
DF <- structure(list(SLP = c(8.6, 7.2, 6.4, 9.5, 6.1, 3.6, 8.6, 7.2,
6.4, 9.5, 6.1, 5.1, 2.1), site = c(1L, 1L, 2L, 3L, 2L, 1L, 1L,
1L, 2L, 3L, 2L, 3L, 2L), year = c(2008L, 2005L, 2006L, 2007L,
2009L, 2005L, 2008L, 2005L, 2006L, 2007L, 2009L, 2008L, 2006L
)), .Names = c("SLP", "site", "year"), class = "data.frame", row.names = c(NA,
-13L))
df %>% group_by(year, site)
将像你的前两行一样正常工作)。Tidyverse 动词自动将数据框作为第一个参数,并使用管道传递给它们的任何内容,除非你另有说明。 - Rose Hartman