将插值函数限制为NA值

3
我正在尝试使用zoo包中的na.spline来替换一些导入速度数据中的NA值,使用三次样条插值计算出新的值。 na.spline能够正确地修改NA值,但它也会修改原本等于0的值。
ex <- data.frame(speed)
ex$speed2 <- na.spline(ex$speed)

我的数据集包含大约1400个值。下面我列出了前40个值。您可以看到原始speed值和错误插值的结果speed 2

speed       speed2
NA          8.639277e-06
0.000000    0.000000e+00
0.000000    0.000000e+00
0.000000    0.000000e+00
0.000000    -1.694066e-21
0.000000    0.000000e+00
0.000000    -2.710505e-20
0.000000    0.000000e+00
0.000000    -4.336809e-19
0.000000    0.000000e+00
0.000000    6.938894e-18
0.000000    0.000000e+00
0.000000    1.110223e-16
2.661698    2.661698e+00
3.107128    3.107128e+00
7.319669    7.319669e+00
10.800864   1.080086e+01
17.855491   1.785549e+01
18.250267   1.825027e+01
28.587002   2.858700e+01
36.405397   3.640540e+01
38.467383   3.846738e+01
38.685956   3.868596e+01
43.917737   4.391774e+01
40.829615   4.082962e+01
43.519173   4.351917e+01
45.597497   4.559750e+01
43.252656   4.325266e+01
45.581646   4.558165e+01
48.258325   4.825832e+01
48.269969   4.826997e+01
50.905045   5.090505e+01
53.258165   5.325817e+01
58.391370   5.839137e+01
59.278440   5.927844e+01
58.720518   5.872052e+01
56.933438   5.693344e+01
62.062116   6.206212e+01
59.860849   5.986085e+01
60.183378   6.018338e+01

有没有人遇到过类似的问题或者有替代方法来用插值数据替换NA值?


请参见此处:https://dev59.com/PHbZa4cB1Zd3GeqPH6CW#18696323 - 虽然 na.spline 应该可以正常工作。 - thelatemail
实际上,从示例数据来看,样条曲线效果很好。你尝试过绘制这两组数据吗? - thelatemail
在大多数应用程序中,我对结果感到满意,但我需要使用这些结果进行一些车辆模拟,并且我需要0速度恰好为0。虽然像1.6 e-21这样的值非常接近于0,但它将是模拟中switch=ONswitch=OFF之间的差异,这是不好的。 - bwhitzo
我真的很好奇这里发生了什么。这似乎是na.spline的完美应用,我希望我能理解结果中的异常情况。 - bwhitzo
1
尝试使用 round(na.spline(df$speed), 6) - Steven Beaupré
1
我同意@StevenBeaupré的观点 - 您需要设置一个公差来确定何时将接近0的值视为实际上的0。 - thelatemail
1个回答

3

内部实现方式如下(不涉及动物园):

y <- c(NA, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2.661698, 3.107128, 
7.319669, 10.800864, 17.855491, 18.250267, 28.587002, 36.405397, 
38.467383, 38.685956, 43.917737, 40.829615, 43.519173, 45.597497, 
43.252656, 45.581646, 48.258325, 48.269969, 50.905045, 53.258165, 
58.39137, 59.27844, 58.720518, 56.933438, 62.062116, 59.860849, 
60.183378)

x <- xout <- seq_along(y)
na <- is.na(y)

splinefun(x[!na], y[!na])(xout)

提供:

 [1]  8.639280e-06  0.000000e+00  0.000000e+00  0.000000e+00  3.388132e-21
 [6]  0.000000e+00 -2.710505e-20  0.000000e+00  4.336809e-19  0.000000e+00
[11]  6.938894e-18  0.000000e+00  0.000000e+00  2.661698e+00  3.107128e+00
[16]  7.319669e+00  1.080086e+01  1.785549e+01  1.825027e+01  2.858700e+01
[21]  3.640540e+01  3.846738e+01  3.868596e+01  4.391774e+01  4.082961e+01
[26]  4.351917e+01  4.559750e+01  4.325266e+01  4.558165e+01  4.825832e+01
[31]  4.826997e+01  5.090505e+01  5.325816e+01  5.839137e+01  5.927844e+01
[36]  5.872052e+01  5.693344e+01  6.206212e+01  5.986085e+01  6.018338e+01

请注意,这将使输出中对应于输入中零值的组件归零:

na.fill(y != 0, 1) * na.spline(y)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接