我正在尝试使用位于http://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/sonar.all-data的可用数据,制作几种分类方法/超参数的k-fold CV。
该数据集由208行组成,每行有60个属性。 我使用read.table函数将其读入数据框中。
下一步是将我的数据分成k个折叠,假设k = 5。 我的第一次尝试是使用:
另一个问题是,它显然是根据属性索引拆分了我的数据,但我想要拆分数据本身。我认为通过转置我的数据框,使用:
但是当我调用createFolds函数时,它会给我返回类似这样的结果:
长度问题已经解决,但是它仍然没有按照我的208数据进行分割。
我该怎么办?caret包可能不是最合适的选择吗?
该数据集由208行组成,每行有60个属性。 我使用read.table函数将其读入数据框中。
下一步是将我的数据分成k个折叠,假设k = 5。 我的第一次尝试是使用:
test <- createFolds(t, k=5)
我对此有两个问题。首先,折叠的长度不相邻:
Length Class Mode
Fold1 29 -none- numeric <br />
Fold2 14 -none- numeric <br />
Fold3 7 -none- numeric <br />
Fold4 5 -none- numeric <br />
Fold5 5 -none- numeric
另一个问题是,它显然是根据属性索引拆分了我的数据,但我想要拆分数据本身。我认为通过转置我的数据框,使用:
test <- t(myDataNumericValues)
但是当我调用createFolds函数时,它会给我返回类似这样的结果:
Length Class Mode
Fold1 2496 -none- numeric <br />
Fold2 2496 -none- numeric <br />
Fold3 2495 -none- numeric <br />
Fold4 2496 -none- numeric <br />
Fold5 2497 -none- numeric
长度问题已经解决,但是它仍然没有按照我的208数据进行分割。
我该怎么办?caret包可能不是最合适的选择吗?