我有一组观测数据,其中包含了响应事件的日期。
structure(list(Date1_P2 = structure(c(14061, 14944, 14944), class = "Date"),
Date2_P2 = structure(c(NA, 11566, 11747), class = "Date"),
Date3_P2 = structure(c(NA, 10408, 11627), class = "Date"),
Date4_P2 = structure(c(NA, 8370, 11566), class = "Date")), .Names = c("Date1_P2",
"Date2_P2", "Date3_P2", "Date4_P2"), row.names = c(NA, 3L), class = "data.frame")
> dates
Date1_P2 Date2_P2 Date3_P2 Date4_P2
1 2008-07-01 <NA> <NA> <NA>
2 2010-12-01 2001-09-01 1998-07-01 1992-12-01
3 2010-12-01 2002-03-01 2001-11-01 2001-09-01
我想创建一个变量,在触发事件的时间范围之内,如果任何日期都落在这个范围内,那么该变量为TRUE
。比如说,2001年9月发生了一些事情,观察结果可能会对此作出反应或者预测。我写了以下函数:
checkmove <- function(event, range, moves){
moves <- as.numeric(moves)
early <- as.numeric(event - range)
late <- as.numeric(event + range)
moved <- any(moves > early & moves < late, na.rm=TRUE)
return(moved)
}
如果事件发生的180天之内有任何一方做出响应,则该值应为TRUE
。该函数逐行处理,但我无法使其在整个表格上工作。
# This is right
> checkmove(as.Date("2001-09-01"), 180, dates[1,])
[1] FALSE
> checkmove(as.Date("2001-09-01"), 180, dates[2,])
[1] TRUE
> checkmove(as.Date("2001-09-01"), 180, dates[3,])
[1] TRUE
# This is wrong
> apply(dates, 1, function(x) checkmove(as.Date("2001-09-01"), 180, x))
1 2 3
FALSE FALSE FALSE
Warning messages:
1: In checkmove(as.Date("2001-09-01"), 180, x) :
NAs introduced by coercion
2: In checkmove(as.Date("2001-09-01"), 180, x) :
NAs introduced by coercion
3: In checkmove(as.Date("2001-09-01"), 180, x) :
NAs introduced by coercion
我是否没有使用正确的apply
函数?我真的很想避免使用for
循环。有没有更好的方法来解决这个问题?
base
和plyr
应用函数之间的分歧是R语言中最大的障碍之一。 - gregmacfarlaneapply
之前将其转换为数字,3)在apply
内部将其转换为日期然后再转回数字(这会更慢,但仍然是一个有效的选项)。 - Michele