我有一个类似下面的数据框 - 实际上更大 - 想知道如何用组内最近的非 NA 值填充整数变量的 NA 值 - 最近的日期不超过观测日期的30天之内,无论是之前还是之后。当存在多个最近的非 NA 值时,我希望选择较早的日期而不是较晚的日期。我找到了this,但它没有考虑连续的 NA 值。
非常感谢任何帮助!
非常感谢任何帮助!
df <- data.frame(
id=c(1,1,1,1,2,2,2,3,3,3,4,4),
dates = c("2023-09-01", "2023-09-02", "2023-09-05", "2023-09-06","2023-09-10" , "2023-09-11",
"2023-09-12", "2023-09-14", "2023-09-16", "2023-09-20", "2023-09-27", "2023-09-28"),
x = c(10, NA, NA, 20, 20, NA, 30, 15, NA, NA, 40, NA)
)
# desired output
x1 <- c(10, 10, 20, 20, 20, 20, 30, 15, 15, 15, 40, 40)
x1[6]
是30,应该是20吧?因为有一个平局,应该选择最早的日期。 - undefined