12得票2回答
在R中使用LASSO算法处理分类变量

我有一个包含1000个观测值和76个变量的数据集,其中约有20个是分类变量。我想在整个数据集上使用LASSO。我知道在LASSO中,无论是使用lars还是glmnet,因子变量都不会真正起作用,但变量太多了,并且它们可以采用太多不同的无序值来合理地将它们重新编码为数字。 在这种情况下,可以...

10得票2回答
如何在glmnet中指定日志链接?

我正在R中使用glmnet和caret包运行广义线性模型上的弹性网络。我的响应变量是成本(其中成本> $0),因此我想为我的GLM指定具有对数链接的高斯族。然而,glmnet似乎不允许我指定(link="log"),如下所示:> lasso_fit <- glmnet(x, y, ...

40得票9回答
从glmnet中提取系数变量名称并放入数据框中

我希望从glmnet生成的模型系数中提取数据,并从中创建一个SQL查询。函数 coef(cv.glmnet.fit) 产生了一个 'dgCMatrix' 对象。当我使用as.matrix 将其转换为矩阵时,变量名丢失,只剩下系数值。 我知道可以将系数打印在屏幕上,但是否可能将名称写入数据框?...

9得票5回答
glmnet如何计算最大的lambda值?

glmnet包使用一系列LASSO调整参数lambda,这些参数是从最大的lambda_max开始缩放的,该值下没有选择任何预测变量。我想知道glmnet如何计算lambda_max值。例如,在一个简单的数据集中: set.seed(1) library("glmnet") x <- ...

16得票3回答
如何在R Studio中解决“保护堆栈溢出”问题

我正在尝试使用glmnet包构建模型,但是当我运行以下代码时出现以下错误:#library('glmnet') x = model.matrix(response ~ ., data = acgh_frame[,c(3:ncol(acgh_frame))]) Error: protect()...

9得票7回答
在glmnet中预测概率时出现错误的解决方法?

我将使用glmnet来预测数据集中的概率。我的代码如下: bank <- read.table("http://www.stat.columbia.edu/~madigan/W2025/data/BankSortedMissing.TXT",header=TRUE) bank$rich...

42得票1回答
R glmnet: "(列表)对象无法强制转换为类型“double”"

我正在尝试在数据集上使用glmnet包。我正在使用cv.glmnet()获取glmnet()的lambda值。这是数据集和错误消息:> head(t2) X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 1 1 1 ...

13得票2回答
在R中并行执行cv.glmnet

我的训练数据集包含约200,000条记录,有500个特征。(这些是来自零售机构的销售数据)。大多数特征都是0/1,并以稀疏矩阵的形式存储。 目标是预测约200个产品的购买概率。因此,我需要使用相同的500个特征来预测200个产品的购买概率。由于glmnet是模型创建的自然选择,我考虑并行实现...

24得票1回答
如何强制cv.glmnet不删除一个特定的变量?

我正在使用glmnet包的cv.glmnet函数对67个观测值和32个变量进行回归。我正在使用变量选择方法。有一个变量我想要强制包含在模型中(在正常过程中被删除)。我该如何在cv.glmnet中指定这个条件? 谢谢! 我的代码看起来像下面这样:glmntfit <- cv.glmne...

9得票2回答
cv.glmnet在使用岭回归时出现错误,但对于lasso回归没有问题——针对模拟数据的研究结果。

Gist 错误信息: Error in predmat[which, seq(nlami)] = preds : replacement has length zero 上下文: 数据使用二进制y进行模拟,但是有n个真实y的编码器。数据被叠加n次,并拟合模型,试图获得true y。 该...