使用glmnet的一个大优点是可以直接处理稀疏矩阵,无需进行转换。这里的帖子似乎表明caret的train函数只能接受数据框作为训练集,而?caret::train也给出了同样的建议。这是否属实?
使用glmnet的一个大优点是可以直接处理稀疏矩阵,无需进行转换。这里的帖子似乎表明caret的train函数只能接受数据框作为训练集,而?caret::train也给出了同样的建议。这是否属实?
glmnet
兼容,例如:@Noobie
library(glmnet)
set.seed(1)
X <- sparseMatrix(i=sample(1:20,20), j=sample(1:20,20), x=sample(1:100,20),
dims=c(20,20)) # some random sparse training data
X
# [1,] . . . 64 . . . . . . . . . . . . . . . .
# [2,] . . . . . . . . . . . . . . 98 . . . . .
# [3,] . . . . . . . . . . . . 43 . . . . . . .
# [4,] . . . . . . . . . . . . . . . . . . . 51
# [5,] . . . . . . . . . 7 . . . . . . . . . .
# [6,] . . . . . . . . . . . . . . . . . . 83 .
# [7,] . . . . . . . 9 . . . . . . . . . . . .
# [8,] . . . . 65 . . . . . . . . . . . . . . .
# [9,] . . . . . . . . . . . . . . . 45 . . . .
#[10,] . 22 . . . . . . . . . . . . . . . . . .
#[11,] . . . . . . . . . . . 77 . . . . . . . .
#[12,] . . . . . . . . 27 . . . . . . . . . . .
#[13,] . . . . . . . . . . . . . . . . 33 . . .
#[14,] . . . . . 75 . . . . . . . . . . . . . .
#[15,] 3 . . . . . . . . . . . . . . . . . . .
#[16,] . . 54 . . . . . . . . . . . . . . . . .
#[17,] . . . . . . . . . . . . . 44 . . . . . .
#[18,] . . . . . . 55 . . . . . . . . . . . . .
#[19,] . . . . . . . . . . 68 . . . . . . . . .
#[20,] . . . . . . . . . . . . . . . . . 39 . .
y <- as.factor(sample(0:1, 20, replace=TRUE))
enet.fit <- glmnet(X, y, family='binomial')
Xtest <- sparseMatrix(i=sample(1:10,10), j=sample(1:20,10), x=sample(1:100,10),
dims=c(10,20)) # some random sparse test data
# [1,] . . . . . 45 . . . . . . . . . . . . . .
# [2,] . . . . . . . . . . . . . . . . . 21 . .
# [3,] . . . . . . . . . . . . . . 97 . . . . .
# [4,] . . . . . . . . . . . 27 . . . . . . . .
# [5,] . . . . 66 . . . . . . . . . . . . . . .
# [6,] . . . . . . . . . . . . . 55 . . . . . .
# [7,] . 35 . . . . . . . . . . . . . . . . . .
# [8,] . . . . . . . . . 86 . . . . . . . . . .
# [9,] . . . . . . 13 . . . . . . . . . . . . .
# [10,] . . . . . . . . . . . . 61 . . . . . . .
predict(enet.fit, newx=Xtest, type='class',s=0.01)
# 1
# [1,] "0"
# [2,] "1"
# [3,] "0"
# [4,] "0"
# [5,] "1"
# [6,] "1"
# [7,] "1"
# [8,] "1"
# [9,] "0"
#[10,] "0"