20得票2回答
大矩阵运行glmnet()

我在使用glmnet套索算法处理一组宽数据集时遇到了问题。我的数据有N=50,但p > 49000,全部是因子变量。所以我必须创建一个模型矩阵才能运行glmnet,但是当我调用model.matrix(formula,data),其中formula = Class ~ .时,我遇到了内存不足的...

15得票3回答
如何在Python中执行逻辑回归Lasso?

Scikit-learn提供Lasso()和LassoCV()函数,但没有选项可以拟合逻辑回归函数而非线性函数...如何在Python中执行逻辑Lasso回归?

14得票4回答
在R的glmnet中,使用$\lambda=0$的LASSO和OLS会产生不同的结果。

我预期LASSO在没有惩罚因子($\lambda=0$)的情况下会产生与OLS拟合相同(或非常相似)的系数估计值。然而,当我将相同的数据(x,y)放入以下两个模型中: glmnet(x, y , alpha=1, lambda=0) 用于LASSO拟合且不使用惩罚因子 lm(y ~ x) ...

14得票2回答
Statsmodels是否实现了LASSO回归?

我希望能够在statsmodels中使用线性LASSO回归,以便使用“公式”符号来编写模型,这将为我在处理许多分类变量及其交互作用时节省大量编码时间。然而,似乎statsmodels尚未实现此功能?

13得票1回答
glmnet交叉验证中默认的lambda序列

请问有人知道 cv.glmnet (在 R 的 glmnet 中) 或 LassoCV (scikit-learn 中的) 如何选择一系列正则化常数 (lambda),并在交叉验证中使用它们吗?非常感谢!

12得票2回答
在R中使用LASSO算法处理分类变量

我有一个包含1000个观测值和76个变量的数据集,其中约有20个是分类变量。我想在整个数据集上使用LASSO。我知道在LASSO中,无论是使用lars还是glmnet,因子变量都不会真正起作用,但变量太多了,并且它们可以采用太多不同的无序值来合理地将它们重新编码为数字。 在这种情况下,可以...

11得票2回答
glmnet中Lasso错误NA/NaN/Inf

我在使用glmnet时遇到了问题,一直收到错误信息:"Error in elnet(x, is.sparse, ix, jx, y, weights, offset, type.gaussian, : NA/NaN/Inf in foreign function call (arg 5) I...

9得票5回答
glmnet如何计算最大的lambda值?

glmnet包使用一系列LASSO调整参数lambda,这些参数是从最大的lambda_max开始缩放的,该值下没有选择任何预测变量。我想知道glmnet如何计算lambda_max值。例如,在一个简单的数据集中: set.seed(1) library("glmnet") x <- ...

7得票1回答
如何使用Vars包中的套索(lasso)功能?

我试图通过惩罚向量自回归方法分析一个高维数据集(31个变量,1100个观测值)。 由于我使用 Diebold et al.(2019)介绍的技术通过方差分解矩阵构建连接度网络,因此我想在 R 中使用他们的包: https://www.rdocumentation.org/packages/v...

7得票3回答
如何使用glmnet在R中计算Lasso回归的R平方值

我正在使用glmnet包在R中执行套索回归: fit.lasso <- glmnet(x,y) plot(fit.lasso,xvar="lambda",label=TRUE) 然后使用交叉验证: cv.lasso=cv.glmnet(x,y) plot(cv.lasso) ...