在多层线性模型（MLMs）/lme4中聚类标准误差

Question

在多层线性模型（MLMs）/lme4中聚类标准误差

rhierarchical-datalme4standard-errormultilevel-analysis

4

如何在R中同时使用集群标准误差和多层模型？

在我的设定中，我在26个国家进行了一项共同实验，每个国家有2000名参与者。像任何共同实验一样，每个参与者都会展示两个小插图，并要求选择/评分每个小插图。然后，同一位参与者会展示另外两个新的小插图进行比较，并被要求重复任务。在这种情况下，每个参与者执行两次比较。因此，比较嵌套在个人和国家之间。目前，我正在运行一个多层模型，其中每个比较属于第1级，国家是第2级单元。显然，个人内的比较很可能具有相关性，因此我想在个人级别上聚类标准误差。在MLM中添加另一层似乎过度设计，因为我的群集大小非常小（n = 2），并且在个人级别上进行分析更有意义（更不用说它使得模型变得非常复杂，因为具有2000个个体* 26个国家，参数空间变得非常巨大）。是否可以做到这一点？如果可以，那么如何在R中与多层模型设置同时完成？

- jonnyf

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Robert Long · Answer 1

0

2 的集群大小不是问题，参数空间也没有任何问题。如果您为参与者和国家拟合随机截距，则这些被估计为潜在的正态分布变量。例如以下模型：

lmer(outomce ~ fixed effects + (1|country/participant)

这将处理集群内的依赖关系（参与者级别和国家级别），因此无需使用集群标准误差。

- Robert Long

感谢您的评论。所以我考虑了一下，最终决定为每个参与者拟合一个随机截距。但是我的教授给了我反馈，指出这并不能解决固定效应的beta值在个体内仍然存在相关性的问题。在我看来，唯一解决这个问题的方法似乎是运行lmer(outcome ~ fixed effects + (1 + fixed effects | country/participant))然而，由于有如此多的随机效应需要运行，这立即变成了一个非常计算密集的模型。 - jonnyf

有一篇由Schuessler和Freitag（2020）撰写的论文https://osf.io/preprints/socarxiv/9yuhp/在第5节中，他们谈到了对共同实验进行聚类SEs，并且如果您不进行聚类，实际上这并不是什么大问题。根据他们的说法，聚类的唯一有效原因是如果您对人口ATE>样本ATE感兴趣，我们也是如此，但即使如此，作者们也表明，在共同点中进行聚类仅会将SEs增加约2％左右。我不确定我能从中获得多少安慰。 - jonnyf