在R语言中使用ifelse处理日期数据

3
我有一个日期向量,如果它在另一个向量之前,我想将日期设置为NA。
我尝试使用ifelse(date_vector1>=date_vector2, date_vector1, NA),但输出不是日期,并且应用as.Date()会返回错误。
然后我尝试了dplyr::if_else(date_vector1>=date_vector2, date_vector1, NA_real_),但它返回相同的错误。
错误是这个:

Error in as.Date.numeric(value) : 'origin' must be supplied

如何使用日期和ifelse语句?

请勿在日期上使用 if_elseifelse。而是尝试使用 setDT(df1)[date_vector>= date_vector2, newcol := date_vector1] - akrun
3个回答

1
我们可以使用 data.table 创建一个新的列。
library(data.table)
setDT(df1)[date_vector1>= date_vector2, newcol := date_vector1]
df1
#   date_vector1 date_vector2     newcol
#1:   2017-05-29   2017-05-13 2017-05-29  
#2:   2017-05-22   2017-05-26       <NA>
#3:   2017-05-26   2017-05-18 2017-05-26
#4:   2017-05-28   2017-05-14 2017-05-28
#5:   2017-05-25   2017-05-27       <NA>

如果这两个向量在数据框/数据表中不是变量,则执行
i1 <- date_vector1>= date_vector2
newvector <- date_vector2
newvector[i1] <- date_vector1[i1]
newvector[!i1] <- NA
newvector
#[1] "2017-05-29" NA           "2017-05-26" "2017-05-28" NA    

最好不要在Date上使用ifelse,因为日期存储为整数,它将强制转换为integer类,我们可能需要使用as.Date(..., origin = '1970-01-01')将其转换回Date类。

数据

set.seed(24)
date_vector1 <- sample((Sys.Date() - 1:10), 5, replace = FALSE)
date_vector2 <- sample((Sys.Date() - 1:20), 5, replace = FALSE)
df1 <- data.frame(date_vector1, date_vector2)

1
我最终选择了 foo=date_vector1foo[date_vector1>= date_vector2]=NA,但是你的答案可能对其他情况非常有价值。 - Dan Chaltiel

1
这是因为ifelse会去掉类属性。你可以使用以下方法恢复它:
date_vector3 <- ifelse(date_vector1>=date_vector2, date_vector1, NA)
class(date_vector3) <- "Date"

0

当其中一个情况是固定值时,我通常使用replace()

date1 <- Sys.Date() + c(-1, 0, 1)
date2 <- Sys.Date() + c(0, 0, 0)

replace(date1, which(date1 < date2), NA)
#> [1] NA           "2022-02-25" "2022-02-26"

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接