在多层线性模型(MLMs)/lme4中聚类标准误差

4

如何在R中同时使用集群标准误差和多层模型?

在我的设定中,我在26个国家进行了一项共同实验,每个国家有2000名参与者。像任何共同实验一样,每个参与者都会展示两个小插图,并要求选择/评分每个小插图。然后,同一位参与者会展示另外两个新的小插图进行比较,并被要求重复任务。在这种情况下,每个参与者执行两次比较。因此,比较嵌套在个人和国家之间。目前,我正在运行一个多层模型,其中每个比较属于第1级,国家是第2级单元。显然,个人内的比较很可能具有相关性,因此我想在个人级别上聚类标准误差。在MLM中添加另一层似乎过度设计,因为我的群集大小非常小(n = 2),并且在个人级别上进行分析更有意义(更不用说它使得模型变得非常复杂,因为具有2000个个体* 26个国家,参数空间变得非常巨大)。是否可以做到这一点?如果可以,那么如何在R中与多层模型设置同时完成?

1个回答

0

2 的集群大小不是问题,参数空间也没有任何问题。如果您为参与者和国家拟合随机截距,则这些被估计为潜在的正态分布变量。例如以下模型:

lmer(outomce ~ fixed effects + (1|country/participant)

这将处理集群内的依赖关系(参与者级别和国家级别),因此无需使用集群标准误差。


感谢您的评论。所以我考虑了一下,最终决定为每个参与者拟合一个随机截距。但是我的教授给了我反馈,指出这并不能解决固定效应的beta值在个体内仍然存在相关性的问题。在我看来,唯一解决这个问题的方法似乎是运行lmer(outcome ~ fixed effects + (1 + fixed effects | country/participant))然而,由于有如此多的随机效应需要运行,这立即变成了一个非常计算密集的模型。 - jonnyf
有一篇由Schuessler和Freitag(2020)撰写的论文https://osf.io/preprints/socarxiv/9yuhp/在第5节中,他们谈到了对共同实验进行聚类SEs,并且如果您不进行聚类,实际上这并不是什么大问题。根据他们的说法,聚类的唯一有效原因是如果您对人口ATE>样本ATE感兴趣,我们也是如此,但即使如此,作者们也表明,在共同点中进行聚类仅会将SEs增加约2%左右。我不确定我能从中获得多少安慰。 - jonnyf

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接