为连续的数值创建索引

5

我有一个向量:

test <-c(1,1,0,2,2,3,4,1,1,0)  
test  
# [1] 1 1 0 2 2 3 4 1 1 0

我想构建一个分组变量,用于指示值何时发生改变:
# [1] 1 1 2 3 3 4 5 6 6 7

什么是最佳的方法来实现这个?
2个回答

7
使用运行长度编码(rle),seq_along和rep。
r <- rle(test)

changes <- rep(seq_along(r$lengths), r$lengths)
changes
## [1] 1 1 2 3 3 4 5 6 6 7

4

替代方案,这种方案只适用于数值型数据。

test <-c(1,1,0,2,2,3,4,1,1,0)  
cumsum(c(1L, diff(test) != 0))
# [1] 1 1 2 3 3 4 5 6 6 7

以下是适用于任何数据类型的复杂变体:

head(cumsum(c(TRUE, c(tail(test, -1), NA) != test)), -1)
# [1] 1 1 2 3 3 4 5 6 6 7

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接