我使用 caret
训练了下面的 rpart
模型。
trainIndex <- createDataPartition(d$Happiness, p=.8, list=FALSE)
dtrain <- d[trainIndex, ]
dtest <- d[-trainIndex, ]
fitControl <- trainControl(## 10-fold CV
method = "repeatedcv", number=10, repeats=10)
fitRpart <- train(Happiness ~ ., data=dtrain, method="rpart",
trControl = fitControl)
testRpart <- predict(fitRpart, newdata=dtest)
dtest
包含1296个观察值,因此我期望 testRpart
生成一个长度为1296的向量。但实际上只有1077个值,即短了219个。
当我在 dtest
的前220行上运行预测时,预测结果为1,因此一直少219个。
请问这是为什么,我该如何获得一致的输出?
编辑: 可以从这里加载 d
来重现上述情况。
d
的链接(2.3 MB)。不确定在 SO 上重现数据的协议是什么:我将其放在我的 Dropbox 中,但这可能不是永久的。有更好的方法吗? - Ricky