我有一个类似这样的数据集:
dat <- data.frame(d1=c(0,1,0,1,0),
d2=c(0,1,1,1,0),d3=c(1,0,1,1,0),
d4=c(1,0,0,0,0),d5=c(1,1,1,0,0))
dat
d1 d2 d3 d4 d5
1 0 0 1 1 1
2 1 1 0 0 1
3 0 1 1 0 1
4 1 1 1 0 0
5 0 0 0 0 0
如果我认为每一行都是一个个体的运行集。我想根据运行计算一个名为“指示器”的指标变量。例如,个体1的运行是(0,0,1,1,1),对于这个向后的运行长度,值第一个1的位置为3。另一方面,对于个体3的运行是(0,1,1,0,1),向后的运行长度,值第一个1的位置为1。所需数据集应如下。
d1 d2 d3 d4 d5 indicator
0 0 1 1 1 3
1 1 0 0 1 1
0 1 1 0 1 1
1 1 1 0 0 3
0 0 0 0 0 0
我已经尝试了这种方式,
indicator <- NULL
for(i in 1:5){
indicator[i] <- rev(sequence(rle(dat[i,])$lengths))[1]
}
indicator[1:5]
cbind(dat, indicator=indicator[1:5])
但这样得到的数据看起来是这样的:
d1 d2 d3 d4 d5 indicator
1 0 0 1 1 1 3
2 1 1 0 0 1 1
3 0 1 1 0 1 1
4 1 1 1 0 0 2
5 0 0 0 0 0 5
有谁能帮我解决这个问题吗?