希望您能对此提供意见。我正在使用遗传编程构建回归模型。
如果在数据比例为1:5的情况下,测试数据的RMSE比训练数据的RMSE(明显)低,我应该担心吗?
测试数据是从24个数据点中随机选择而来,并且没有替换。该模型是使用遗传编程技术构建的,因此特征数量、建模框架等会随着最小化GP树中节点数量的训练RMSE而变化。
这个模型是欠拟合的吗?或者我应该最小化MSE而不是RMSE(我认为如果优化器足够好,则MSE是正的,MSE的最小值将与RMSE的最小值重合)?
谢谢
希望您能对此提供意见。我正在使用遗传编程构建回归模型。
如果在数据比例为1:5的情况下,测试数据的RMSE比训练数据的RMSE(明显)低,我应该担心吗?
测试数据是从24个数据点中随机选择而来,并且没有替换。该模型是使用遗传编程技术构建的,因此特征数量、建模框架等会随着最小化GP树中节点数量的训练RMSE而变化。
这个模型是欠拟合的吗?或者我应该最小化MSE而不是RMSE(我认为如果优化器足够好,则MSE是正的,MSE的最小值将与RMSE的最小值重合)?
谢谢
所以你的模型是在24个数据点中训练了20个,然后在剩下的4个数据点上进行了测试?
对我来说,这听起来像是你需要(更多)数据,以便你可以拥有更大的训练集和测试集。我对你的测试集表现不佳并不感到惊讶,因为似乎你的模型无法从如此少的数据中学习。机器学习的经验法则是,永远不能有足够的数据。有没有可能收集更大的数据集呢?