我正在尝试使用glmmLasso在广义线性混合模型中进行变量选择,但是出现了错误和警告,我无法解决。数据集不平衡,一些参与者(PTNO)比其他参与者拥有更多样本;没有缺失数据。我的因变量是二进制的,除了ID变量PTNO之外的所有其他变量都是连续的。 我怀疑发生了非常普通的事情,但显然没有看到它,并且在文档或网络上没有找到任何解决方案。 代码基本上只是从glmmLasso足球示例调整而来:
glm8 <- glmmLasso(Group~NDUFV2_dCTABL+GPER1_dCTABL+ ESR1_dCTABL+ESR2_dCTABL+KLF12_dCTABL+SP4_dCTABL+SP1_dCTABL+ PGAM1_dCTABL+ANK3_dCTABL+RASGRP1_dCTABL+AKT1_dCTABL+NUDT1_dCTABL+ POLG_dCTABL+ ADARB1_dCTABL+OGG_dCTABL+ PDE4B_dCTABL+ GSK3B_dCTABL+ APOE_dCTABL+ MAPK6_dCTABL, rnd = list(PTNO=~1),
family = poisson(link = log), data = stackdata, lambda=100,
control = list(print.iter=TRUE,start=c(1,rep(0,29)),q.start=0.7))
下面显示了错误消息。具体来说,我不认为数据集中有任何NA,并且我对关于因子变量的警告的含义不确定。
提供了包含必要变量的简略数据集(R格式),可以从此处下载。希望能够得到一些关于如何继续分析的指导。如果数据集有问题或无法下载,请告诉我。非常感谢您的帮助。迭代1 Error in grad.lasso[b.is.0] <- score.beta[b.is.0] - lambda.b * sign(score.beta[b.is.0]) : 子脚本赋值中不允许出现NAs。 此外:警告消息: 在Ops.factor(y, Mu)中:“-” 对于因子没有意义。