在R代码中根据特定值的连续出现次数计算变量

3

我有一个类似这样的数据集:

 dat <- data.frame(d1=c(0,1,0,1,0),
      d2=c(0,1,1,1,0),d3=c(1,0,1,1,0),
      d4=c(1,0,0,0,0),d5=c(1,1,1,0,0))
 dat
  d1 d2 d3 d4 d5
1  0  0  1  1  1
2  1  1  0  0  1
3  0  1  1  0  1
4  1  1  1  0  0
5  0  0  0  0  0

如果我认为每一行都是一个个体的运行集。我想根据运行计算一个名为“指示器”的指标变量。例如,个体1的运行是(0,0,1,1,1),对于这个向后的运行长度,值第一个1的位置为3。另一方面,对于个体3的运行是(0,1,1,0,1),向后的运行长度,值第一个1的位置为1。所需数据集应如下。
  d1 d2 d3 d4 d5 indicator
   0  0  1  1  1   3
   1  1  0  0  1   1
   0  1  1  0  1   1
   1  1  1  0  0   3 
   0  0  0  0  0   0

我已经尝试了这种方式,
    indicator <- NULL      
    for(i in 1:5){
        indicator[i] <- rev(sequence(rle(dat[i,])$lengths))[1]
     }
    indicator[1:5]
   cbind(dat, indicator=indicator[1:5])

但这样得到的数据看起来是这样的:
  d1 d2 d3 d4 d5 indicator
1  0  0  1  1  1         3
2  1  1  0  0  1         1
3  0  1  1  0  1         1
4  1  1  1  0  0         2
5  0  0  0  0  0         5

有谁能帮我解决这个问题吗?

2个回答

5

尝试

val <- apply(dat, 1, function(x) with(rle(rev(x)==1), lengths[values])[1])
dat$indicator <- replace(val, is.na(val),0)
dat
#   d1 d2 d3 d4 d5 indicator
#1  0  0  1  1  1         3
#2  1  1  0  0  1         1
#3  0  1  1  0  1         1
#4  1  1  1  0  0         3
#5  0  0  0  0  0         0

1
另一种方法:

x = apply(rev(dat),1, function(u) ifelse(u[1]==1, match(0,u)-1, match(1,u)))
transform(dat, indicator = ifelse(is.na(x), 0,x))

#  d1 d2 d3 d4 d5 indicator
#1  0  0  1  1  1         3
#2  1  1  0  0  1         1
#3  0  1  1  0  1         1
#4  1  1  1  0  0         3
#5  0  0  0  0  0         0

真的,我尝试了使用矩阵进行向量化解决方案,并保留了该命令!已编辑。 - Colonel Beauvel

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接