我有一个关于p值的问题。我一直在使用R中的以下函数比较不同的线性模型,以确定一个模型是否比另一个更好。
anova(model1,model2)
不幸的是,有时它无法计算F值或p值。这里是一个未给出p值的ANOVA摘要示例。
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 2655.2 -1 435.74
为了对称起见,这里也有一个ANOVA总结,它确实得出了p值。
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 3157.6 -1 -66.652 2.7386 0.1004
你知道为什么会出现这个问题吗?
anova
调用中首先列出更简单的模型,(2)在模型表达式之外对数据进行子集处理;那只会让事情变得混乱和凌乱,(3)检查这个问题(来自?anova
):“仅当两个或多个模型适合于相同的数据集时,它们之间的比较才是有效的。如果存在缺失值并且使用R的默认na.action = na.omit,则可能会出现问题。” - bdemarest