这是一种有用且常见的做法,将回归预测的值和残差作为不同的列添加到数据帧中。我对pandas不熟悉,无法完成这个非常简单的操作,我知道我缺少了一些显而易见的东西。大约一年半前,有一个非常相似的问题被提出,但并没有得到真正的答案。
数据帧当前看起来像这样:
y x1 x2
880.37 3.17 23
716.20 4.76 26
974.79 4.17 73
322.80 8.70 72
1054.25 11.45 16
我想要返回一个数据框,其中包含每个观测值的y = x1 + x2的预测值和残差:
y x1 x2 y_hat res
880.37 3.17 23 840.27 40.10
716.20 4.76 26 752.60 -36.40
974.79 4.17 73 877.49 97.30
322.80 8.70 72 348.50 -25.70
1054.25 11.45 16 815.15 239.10
我已经尝试使用statsmodels和pandas来解决这个问题,但是一直没有成功。提前感谢!