假设我有以下数据框:
在'A'列中,缺失的值需要使用序列中最近3个非空值的平均值进行替换,如果存在的话。
例如,在索引5处的NaN具有18作为其最近的非空值,并且在18之后,下两个值也是非空的。因此,在索引5处的NaN被替换为(18 + 19 + 17)/ 3。
在索引4处的NaN具有24作为其最近的非空值,但是24之前的两个值是非空的。因此,在索引4处的NaN不会被替换为任何值。
类似地,需要对其余的列进行处理。是否有人知道一种向量化的方法来完成这项工作?
谢谢!
A B
0 NaN 12
1 NaN NaN
2 24 NaN
3 NaN NaN
4 NaN 13
5 NaN 11
6 NaN 13
7 18 NaN
8 19 NaN
9 17 NaN
在'A'列中,缺失的值需要使用序列中最近3个非空值的平均值进行替换,如果存在的话。
例如,在索引5处的NaN具有18作为其最近的非空值,并且在18之后,下两个值也是非空的。因此,在索引5处的NaN被替换为(18 + 19 + 17)/ 3。
在索引4处的NaN具有24作为其最近的非空值,但是24之前的两个值是非空的。因此,在索引4处的NaN不会被替换为任何值。
类似地,需要对其余的列进行处理。是否有人知道一种向量化的方法来完成这项工作?
谢谢!