我不太理解输出结果中的p值具体意义。我的意思不是说p值本身,而是在这种情况下。
> Model 1: sl ~ le + ky
> Model 2: sl ~ le
Res.Df RSS Df Sum of Sq F Pr(>F)
1 97 0.51113
2 98 0.51211 -1 -0.00097796 0.1856 0.6676
我得到了这样的结果,现在我在想哪个模型更适合。 由于只有一个p值而不是两个,我感到很困惑。 使用summary(model1)或summary(model2)我得到不同的p值。
如果现在
> fm2<-lm(Y~X+T)
(T是我的指示变量)和
> fm4<-lm(Y~X)
如果我这样做
> anova(fm2,fm4)
这是对零假设进行测试的内容,H0: alpha1==alpha2
(Ha: alpha1!=alpha2)
其中c(alpha)是我的截距。
因此测试的是是否应该只有一个截距(=> alpha1==alpha2
),还是两个截距 (alpha1!=alpha2
)。
在这种情况下,由于p值为0.6676,我们现在明显地拒绝了零假设。
这意味着我们应该坚持使用模型fm4
,因为它更适合我们的数据。
我得出的结论正确吗?我尽力了,但不确定p值的含义。因为只有一个,所以我想这可能是它的含义。 能否有人澄清一下情况?