我正在尝试根据分组因素计算“滚动”摘要统计信息。是否有一种好的方法可以基于(比如)有序因素来处理(重叠)组?
例如,假设我想通过组来计算
对于基于
然而,我想做的是计算连续组(“a”和“b”,然后“b”和“c”等)的“滚动”总和。期望的输出结果应该类似于这样:
例如,假设我想通过组来计算
val
的总和。df <- data.frame(grp = c("a", "a", "b", "b", "c", "c", "c"),
val = rnorm(7))
对于基于
grp
的群组,这很容易:df %>% group_by(grp) %>% summarise(total = sum(val))
# result:
grp total
1 a 1.6388
2 b 0.7421
3 c 1.1707
然而,我想做的是计算连续组(“a”和“b”,然后“b”和“c”等)的“滚动”总和。期望的输出结果应该类似于这样:
grp1 grp2 total
1 a b 1.6388
2 b c 0.7421
我在使用dplyr时遇到了麻烦。特别是,我似乎无法弄清如何获得“重叠”的分组 - 上面示例中的“b”行应该分成 两个 输出组。
a,b,c,a,c,d,b,a
这样是连续的,那该怎么办? - vrajs5