我的问题是如何在R中计算自上次事件以来的天数。以下是数据的最小示例:
df <- data.frame(date=as.Date(c("06/07/2000","15/09/2000","15/10/2000","03/01/2001","17/03/2001","23/05/2001","26/08/2001"), "%d/%m/%Y"),
event=c(0,0,1,0,1,1,0))
date event
1 2000-07-06 0
2 2000-09-15 0
3 2000-10-15 1
4 2001-01-03 0
5 2001-03-17 1
6 2001-05-23 1
7 2001-08-26 0
一个二元变量(事件)的值为1表示事件发生,值为0表示未发生。在不同时间(date
)进行重复观察。预期输出如下,包括自上次事件以来的天数(tae
):
date event tae
1 2000-07-06 0 NA
2 2000-09-15 0 NA
3 2000-10-15 1 0
4 2001-01-03 0 80
5 2001-03-17 1 153
6 2001-05-23 1 67
7 2001-08-26 0 95
我曾经寻找过类似问题的答案,但它们没有解决我的具体问题。我尝试实现了来自一个相似帖子 (Calculate elapsed time since last event) 的想法,下面是我接近解决方案的代码:
library(dplyr)
df %>%
mutate(tmp_a = c(0, diff(date)) * !event,
tae = cumsum(tmp_a))
这将产生下面所示的输出,与预期的输出略有不同:
date event tmp_a tae
1 2000-07-06 0 0 0
2 2000-09-15 0 71 71
3 2000-10-15 1 0 71
4 2001-01-03 0 80 151
5 2001-03-17 1 0 151
6 2001-05-23 1 0 151
7 2001-08-26 0 95 246
任何关于如何微调这个或其他方法的帮助都将不胜感激。
as.Date('2001-01-03')-as.Date('2000-10-15')
时间差为80天。这是自2000年10月15日发生的上一个事件以来的天数。明白了吗? - amo