我有一个如下所示的 data.frame
:
dat <- data.frame("ID"=c(rep(1,13),rep(2,5)), "time"=c(seq(1,13),c(seq(1,5))), "value"=c(rep(0,5), rep(1,3), 2, 0, 1, 5, 20, rep(0,2), seq(1:3)))
ID time value
1 1 1 0
2 1 2 0
3 1 3 0
4 1 4 0
5 1 5 0
6 1 6 1
7 1 7 1
8 1 8 1
9 1 9 2
10 1 10 0
11 1 11 1
12 1 12 5
13 1 13 20
14 2 1 0
15 2 2 0
16 2 3 1
17 2 4 2
18 2 5 3
我的目标是将所有值设置为
0
,如果在剩余的值中有任何其他的0
(对于每个独特的ID
并按time
排序)。这意味着在示例数据中,我希望在第6行到第9行中有0
。我尝试了
dat %>% group_by(ID) %>% mutate(value2 = ifelse(lead(value, order_by=time)==0, 0, value))
,但我需要多次运行它,因为它只能一次更改一行(即先更改第9行,然后是第8行等)。首选使用
dplyr
解决方案,但我接受任何有效的方法 :)简短说明:value是肿瘤的大小。如果肿瘤没有增长,而是在以后的时间完全消失,它很可能是一个无关的包囊,因此应该编码为“零肿瘤”。