如果我使用 "aggregate" 函数或 "dplyr" 包中的 "summarise" 进行计算,为什么会得到不同顺序的答案?
例如:
给我
并且。
为什么顺序不同?
例如:
a <- aggregate(hp~mpg+cyl+gear, mtcars, FUN = sum)
给我
mpg cyl gear hp
1 21.5 4 3 97
2 18.1 6 3 105
3 21.4 6 3 110
4 10.4 8 3 420
5 13.3 8 3 245
并且。
b <- mtcars %>%
group_by(mpg, cyl, gear) %>%
summarise(hp = sum(hp))
给我
mpg cyl gear hp
<dbl> <dbl> <dbl> <dbl>
1 10.4 8 3 420
2 13.3 8 3 245
3 14.3 8 3 245
4 14.7 8 3 230
5 15 8 5 335
为什么顺序不同?
group_by
按mpg
、cyl
和gear
排序列,因此您会得到相同的输出,只是排序不同。 - hannes101group_by
函数总是会重新排序。 - zx8754