我没有看到设置参数的选项。
是否有另一种方法可以访问
这种需求的原因是模型中使用的响应变量是对数转换的,计算的交叉验证误差可能会误导。如果我们可以访问交叉验证数据集,那么我们将能够知道使用了哪些观测值,然后使用未转换的响应来与特定折叠中使用的模型预测值进行比较。
keep_cross_validation_predictions
和
keep_cross_validation_fold_assignment
在h2o R包中的h2o.automl()
中。是否有另一种方法可以访问
h2o.automl()
调用中使用的交叉验证数据集?这种需求的原因是模型中使用的响应变量是对数转换的,计算的交叉验证误差可能会误导。如果我们可以访问交叉验证数据集,那么我们将能够知道使用了哪些观测值,然后使用未转换的响应来与特定折叠中使用的模型预测值进行比较。
fold_column
以提供自定义分组(折叠赋值)。手动使用fold_column
分配折叠将允许跟踪整个 AutoML 流水线中的 cv 数据集并运行必要的比较。http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/fold_column.html - topchef