我希望您能为我提供一些有关拟合广义线性混合效应模型的策略,以适用于相对较大的数据集。请注意,以下是需要进行处理的数据内容:我有关于10年内约300支球队中800万次美国篮球传球的数据。数据大致如下所示:
我想解释球员传球前所需走的步数
我的个体级别控制变量是
在团队层面上,我有
我一直在使用
我正在寻找加速拟合过程或拟合广义线性混合效应模型的新技术建议:
data <- data.frame(count = c(1,1,2,1,1,5),
length_pass= c(1,2,5,7,1,3),
year= c(1,1,1,2,2,2),
mean_length_pass_team= c(15,15,9,14,14,8),
team= c('A', 'A', 'B', 'A', 'A', 'B'))
data
count length_pass year mean_length_pass_team team
1 1 1 1 15 A
2 1 2 1 15 A
3 2 5 1 9 B
4 1 7 2 14 A
5 1 1 2 14 A
6 5 3 2 8 B
我想解释球员传球前所需走的步数
count
。我有理论动机认为在count
和length_pass
之间存在团队层面的差异,因此多层次(即混合效应)模型似乎是合适的选择。我的个体级别控制变量是
length_pass
和year
。在团队层面上,我有
mean_length_pass_team
。根据Snijders, 2011,这应该有助于我避免生态谬误。我一直在使用
lme4
和brms
包来估计这些模型,但在我的本地12核128GB机器上拟合这些模型需要几天/几周的时间。library(lme4)
model_a <- glmer(count ~ length_pass + year + mean_length_pass_team + (1 | team),
data=data,
family= "poisson",
control=glmerControl(optCtrl=list(maxfun=2e8)))
library(brms)
options (mc.cores=parallel::detectCores ())
model_b <- brm(count ~ length_pass + year + mean_length_pass_team + (1 | team),
data=data,
family= "poisson")
我正在寻找加速拟合过程或拟合广义线性混合效应模型的新技术建议:
- 如何提高
lme4
和brms
模型拟合速度? - 是否有其他可考虑的软件包?
- 是否有可以帮助增加模型拟合速度的逐步步骤程序?
- 是否有R环境之外的有趣选项可以帮助我进行拟合?