我正在使用glmnet程序包进行LASSO回归。是否有一种方法可以获取所选个别变量的重要性?我考虑通过coef(...)命令获得的系数进行排名(即,离零越远,变量越重要)。这样做是否有效?谢谢您的帮助!
cvfit = cv.glmnet(x, y, family = "binomial")
coef(cvfit, s = "lambda.min")
## 21 x 1 sparse Matrix of class "dgCMatrix"
## 1
## (Intercept) 0.14936
## V1 1.32975
## V2 .
## V3 0.69096
## V4 .
## V5 -0.83123
## V6 0.53670
## V7 0.02005
## V8 0.33194
## V9 .
## V10 .
## V11 0.16239
## V12 .
## V13 .
## V14 -1.07081
## V15 .
## V16 .
## V17 .
## V18 .
## V19 .
## V20 -1.04341
glmnet
会对输入变量进行缩放,因此在某种意义上,您选择具有最高“缩放效果”的变量。这在某种程度上是有道理的,实际上有一些论文试图解决这个特定的问题(还有Hastie和Tibshirani的最新书籍也讨论了这个问题)。然而,这确实是一个适合在StackExchange上提问的问题。 - ekstroem