lmer()和anova()之间模型适合度估计的差异

3

我想使用lmer()对生物数据的治疗效果进行时间建模,以考虑个体效应。 通常使用的方法是逐步删除固定效应和交互项来构建多个模型,然后使用anova(model1,model2)找到最佳模型,并在发现非显著差异时保留最简模型。 然而,我发现summary(model1)anova(model1,model2)的输出之间存在不同的模型适合度值(AIC、BIC等)。 以下是代码:

#Data are in z6
m1<-lmer(Brightness~factor(FT)*factor(Time)+(1|ID),z6)
m2<-lmer(Brightness~factor(FT)+factor(Time)+(1|ID),z6)
summary(m1)@AICtab 
AIC     BIC    logLik deviance  REMLdev
2284.223 2335.65 -1128.112  2301.36 2256.223
summary(m2)@AICtab
AIC      BIC    logLik deviance  REMLdev
2298.247 2331.307 -1140.124  2302.42 2280.247
anova(m1,m2)
Data: z6
Models:
m2: Brightness ~ factor(FT) + factor(Time) + (1 | ID)
m1: Brightness ~ factor(FT) * factor(Time) + (1 | ID)
Df    AIC    BIC  logLik  Chisq Chi Df Pr(>Chisq)
m2  9 2320.4 2353.5 -1151.2                         
m1 14 2329.4 2380.8 -1150.7 1.0601      5     0.9576

在比较summary()输出时,两个模型之间有14个AIC单元的差异,但在anova()中只有9个。这个差异来自哪里呢? 谢谢。


这个问题非常适合在crossvalidated.com上进行讨论。 - Roman Luštrik
1个回答

6
您的模型具有不同的固定效应,因此通过REML进行模型比较不合适。方法anova()知道这一点并计算ML估计值。方法summary()使用REML估计值(后者在输出中清楚地指示)。
请注意,两个摘要和anova()输出中的logLik值是不同的。前者是REML对数似然,后者是ML似然。由于AIC等是对数似然的函数,这足以解释所报告的AIC差异。
如果模型比较涉及到固定效应的差异,则anova()方法可以计算ML估计值,如果模型未通过REML拟合,则会执行正确的操作。
如果您将在研究中使用这些方法,我强烈建议您阅读关于REML和ML估计以及它们的相对优点、用途等的相关文献,如果以上内容对您来说是新闻的话。

非常感谢,要将估计改为最大似然估计,必须将lmer公式中的REML参数设置为FALSE(TRUE是默认值)。 - Lionel
@Lionel 谢谢。如果这个回答解决了你的问题,你可以在答案旁边打勾标记表示如此吗?请参阅 FAQ 中的 [ask] 部分,了解如何执行此操作以及它的有用性等。 - Gavin Simpson

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接