21得票2回答
在R中使用glm指定公式而不需要显式声明每个协变量

我想要将特定变量强制输入到glm回归模型,而不需要完全指定每一个变量。我的真实数据集有约200个变量。目前为止,在线搜索中我还没有找到这方面的示例。 例如(仅使用3个变量):n=200 set.seed(39) samp = data.frame(W1 = runif(n, min = 0...

21得票3回答
为什么Caret训练会占用这么多内存?

当我只使用 glm 进行训练时,一切正常,并且我甚至没有接近耗尽内存。但是当我运行 train(..., method='glm') 时,我会用完内存。 这是因为 train 在交叉验证的每次迭代(或者其他 trControl 过程)中存储了大量数据吗?我查看了 trainControl,但...

21得票2回答
为什么从glmnet模型获取回归系数的统计摘要信息是不可取的?

我有一个二元结果的回归模型。我使用glmnet拟合了该模型,并获得了所选择的变量及其系数。 由于glmnet不计算变量重要性,我想将精确的输出(所选变量及其系数)馈送给glm以获取信息(标准误差等)。 我搜索了r文档,似乎可以使用glm中的“method”选项指定用户定义函数。但我没有成功...

17得票2回答
在R中使用glm(..)获取95%置信区间

这里是一些数据dat = data.frame(y = c(9,7,7,7,5,6,4,6,3,5,1,5), x = c(1,1,2,2,3,3,4,4,5,5,6,6), color = rep(c('a','b'),6)) 以及如果您希望的话,这些数据的情节。require(ggplot...

17得票4回答
在R的glm模型中选择具有统计学意义的变量

我有一个目标变量Y和一列可能影响Y的100个维度(假设为X1...X100)。 运行我的glm并查看模型摘要后,我可以看到那些具有统计显著性的变量。我想能够选择这些变量并运行另一个模型来比较性能。是否有一种方法可以解析模型摘要并仅选择那些显著的变量?

16得票2回答
在R语言中,glmnet()和cv.glmnet()有什么区别?

我正在开发一个项目,旨在展示一组事件对结果的潜在影响。我正在使用glmnet()包,具体使用泊松特征。这是我的代码:# de <- data imported from sql connection x <- model.matrix(~.,data = de[,2...

16得票1回答
使用broom::augment函数获得响应比例下的预测值

我正在使用R拟合glm模型,可以使用predict.glm(object=fm1, type="response")得到响应比例尺下的预测值,其中fm1是拟合的模型。我想知道如何使用broom包中的augment函数得到响应比例尺下的预测值。以下是我的最小工作示例。Dilution <-...

16得票6回答
R错误提示说:“模型未全部拟合到相同大小的数据集上”。

我已经创建了两个广义线性模型,如下所示:glm1 <-glm(Y ~ X1 + X2 + X3, family=binomial(link=logit)) glm2 <-glm(Y ~ X1 + X2, family=binomial(link=logit)) 然后我使用anov...

15得票1回答
如何从非常大的数据集 (尤其是从 rxGlm 输出) 绘制交互效应

我目前正在使用巨大的数据集计算glm模型。无论是glm还是speedglm,都需要几天时间来计算。 我目前拥有约3M个观察值和共400个变量,只有其中一部分用于回归。在回归中,我使用了4个整数自变量(iv1、iv2、iv3、iv4),1个二元自变量作为因子(iv5),交互项(x * y,其中...

15得票3回答
如何在R中拟合自回归泊松混合模型(计数时间序列)?

我的任务是评估各种环境变量如何影响年度人口波动。为此,我需要为时间序列计数拟合泊松自回归模型: 其中Ni,j是观察到的第i个站点在第j年的个体计数,xi,j是第i个站点在第j年的环境变量 - 这些是输入数据,其余是参数:\mui,j是第i个站点在第j年预期的个体数量,\gammaj是每年...