我有一个包含三个级别(
我还有一个连续变量,其中一些值是缺失的。
我希望用各组的平均值替换
我知道可以计算每个组的平均值并替换缺失值,但我确定有另一种更高效的方法,可以使用循环实现。
A
、B
和C
)的分类变量。我还有一个连续变量,其中一些值是缺失的。
我希望用各组的平均值替换
NA
值。也就是说,来自组A
的缺失观察值必须用A
组的平均值替换。我知道可以计算每个组的平均值并替换缺失值,但我确定有另一种更高效的方法,可以使用循环实现。
A <- subset(data, group == "A")
mean(A$variable, rm.na = TRUE)
A$variable[which(is.na(A$variable))] <- mean(A$variable, na.rm = TRUE)
现在,我明白我可以对组B
和C
执行相同的操作,但也许一个带有if
和else
的for
循环可以解决问题?