RepeatedKFold是什么意思?

8

假设n_repeats=5,折叠数为3 (n_splits=3)。

这是否意味着验证器会为我们的估计器/模型创建3个折叠,以便每个折叠都能使用(就像KFold一样),然后重复这个过程5次?

这意味着我们的模型将使用总共15个折叠?

1个回答

10

是的,你基本上可以通过在循环中调用KFolds.split() n_repeats次来实现相同的效果。

示例设置:

X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
y = np.array([0, 0, 1, 1])

然后运行:

rkf = RepeatedKFold(n_splits=2, n_repeats=1, random_state=2652124)
for train_index, test_index in rkf.split(X):
  print("TRAIN:", train_index, "TEST:", test_index)

...会产生:

TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]

... 就像 KFold(n_splits=2, random_state=2652124) 一样。将其改为 n_repeats=2 会产生:

TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]
TRAIN: [1 2] TEST: [0 3]
TRAIN: [0 3] TEST: [1 2]

等等,等等。


1
我也从文档中找到了答案,并理解了其原理。另外,感谢您建议使用循环调用KFold以达到相同的效果! - jasonlcy91
如果我们在RepeatedKFold中将n_repeats=2,并且在Kfold中将n_splits=4更改,结果将不相同。我在这里错过了什么? - Murilo
如果我们在RepeatedKFold中将n_repeats=2,并且在Kfold中将n_splits=4进行更改,结果将不相同。我在这里漏掉了什么? - undefined

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接