Logit回归:glmer vs bife

3

我正在处理一个面板数据集,并尝试使用固定效应运行logit回归。

我发现lme4包和bife包中的glmer模型适用于这种工作。

但是,当我分别使用每个模型运行回归时,结果(估计值、标准误差等)并不相同。

以下是带有截距项的glmer模型的代码和结果:

glmer_1 <- glmer(CVC_dummy~at_log + (1|year), data=own, family=binomial(link="logit"))
summary(glmer_1)

             Estimate  Std. Error  zvalue  Pr(>|z|)    
(Intercept) -6.43327    0.09635   -66.77   <2e-16 ***
at_log       0.46335    0.01101    42.09   <2e-16 ***

没有拦截器:

glmer_2 <- glmer(CVC_dummy~at_log + (1|year)-1, data=own, family=binomial(link="logit"))
summary(glmer_2)

        Estimate  Std.Error  z value  Pr(>|z|)    
at_log  0.46554    0.01099   42.36   <2e-16 ***

使用bife包:

使用bife包可以:

bife_1 <- bife(CVC_dummy~at_log | year, data=own, model="logit")
summary(bife_1)

        Estimate  Std. error  t-value  Pr(> t)    
at_log   0.4679    0.0110      42.54   <2e-16 ***

为什么两个软件包中的 at_log 的估计系数不同?

我应该使用哪个软件包?


1
该软件包的结果取决于解决混合效应模型(具有随机和固定效应的面板数据)的实现算法。据我所知,bife软件包使用一种称为“伪去均值化”的方法,而lme4则使用数值积分通过拉普拉斯近似(和类似方法)来解决条件密度。在这两种情况下,不能保证它们将产生(甚至可能是相似的)结果。要知道哪个更好,这是一个研究课题,而不是一个编程课题。 - Oliver
1个回答

0

固定效应和随机效应这两个术语常常让人感到混淆。从你的第一句话来看,我猜测你想计算一个固定效应模型。

然而,bife 计算的是固定效应模型,而 glmer 则计算随机效应模型/混合效应模型。

这两者经常被混淆,因为随机效应模型在固定效应(通常是你感兴趣的自变量系数)和随机效应(随机截距和/或随机斜率的方差/标准偏差)之间有所不同。

另一方面,固定效应模型之所以被称为固定效应模型,是因为它通过为每个组包括一个虚拟变量(-1)来消除个体差异,从而为每个组包括一个固定效应。

然而,并非所有的固定效应模型都是通过包含指示变量来工作的:Bife 使用伪均值化方法,但结果相同,仍然被称为固定效应模型。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接