16得票2回答
在R语言中,glmnet()和cv.glmnet()有什么区别?

我正在开发一个项目,旨在展示一组事件对结果的潜在影响。我正在使用glmnet()包,具体使用泊松特征。这是我的代码:# de <- data imported from sql connection x <- model.matrix(~.,data = de[,2...

16得票3回答
如何在R Studio中解决“保护堆栈溢出”问题

我正在尝试使用glmnet包构建模型,但是当我运行以下代码时出现以下错误:#library('glmnet') x = model.matrix(response ~ ., data = acgh_frame[,c(3:ncol(acgh_frame))]) Error: protect()...

16得票2回答
glmnet的标准化参数如何处理虚拟变量?

在我的数据集中,我有一些连续变量和虚拟变量。为了使用glmnet进行分析,我希望对连续变量进行标准化,但不对虚拟变量进行标准化。 我目前通过首先定义一个仅包含值[0,1]的列的虚拟向量,然后对所有非虚拟列使用scale命令来手动执行此操作。问题是,这不是很优雅。 但是glmnet有一个内置...

14得票2回答
“x”和“w”的长度必须相同 - 在weighted.mean.default中出现错误

我在R语言的glmnet包中遇到了问题。我尝试直接使用它,但却遇到了以下问题:test <- glmnet(seq.trans,rsem.trans) 在 weighted.mean.default(y, weights) 中出现错误: 'x' 和 'w' 必须具有...

13得票2回答
R向量大小限制:“long vectors (argument 5) are not supported in .C”

我有一个非常大的矩阵,我正试图在一台内存充足的服务器上通过glmnet运行它。即使在非常大的数据集上,它也能正常工作,但在某个点之后,我会得到以下错误:Error in elnet(x, ...) : long vectors (argument 5) are not supported in...

13得票1回答
glmnet交叉验证中默认的lambda序列

请问有人知道 cv.glmnet (在 R 的 glmnet 中) 或 LassoCV (scikit-learn 中的) 如何选择一系列正则化常数 (lambda),并在交叉验证中使用它们吗?非常感谢!

13得票2回答
在R中并行执行cv.glmnet

我的训练数据集包含约200,000条记录,有500个特征。(这些是来自零售机构的销售数据)。大多数特征都是0/1,并以稀疏矩阵的形式存储。 目标是预测约200个产品的购买概率。因此,我需要使用相同的500个特征来预测200个产品的购买概率。由于glmnet是模型创建的自然选择,我考虑并行实现...

12得票2回答
在R中使用LASSO算法处理分类变量

我有一个包含1000个观测值和76个变量的数据集,其中约有20个是分类变量。我想在整个数据集上使用LASSO。我知道在LASSO中,无论是使用lars还是glmnet,因子变量都不会真正起作用,但变量太多了,并且它们可以采用太多不同的无序值来合理地将它们重新编码为数字。 在这种情况下,可以...

12得票1回答
在caret中提取glmnet模型的最佳调参参数的系数

我正在使用glmnet在caret中运行弹性网络正则化。 我将一系列值传递给trainControl来进行alpha和lambda的调整,然后执行repeatedcv以获取最佳的alpha和lambda调整参数。 以下是一个示例,其中alpha和lambda的最佳调整参数分别为0.7和0....

11得票1回答
glmnet:在逻辑回归中,我如何知道哪个响应因子水平被编码为1?

我有一个 logistic 回归模型,使用了 glmnet 包。我的响应变量被编码为一个因子,其水平值我将称之为 "a" 和 "b"。 logistic 回归的数学中,将两个类别中的一个标记为 "0",另一个标记为 "1"。logistic 回归模型的特征系数可以是正数、负数或零。如果一个特...