我正在尝试解决一些分类问题。看起来许多经典方法都遵循相似的范式,即使用某个训练集训练模型,然后用它来预测新实例的类标签。
我想知道是否有可能将某种反馈机制引入到这个范式中。在控制理论中,引入反馈回路是提高系统性能的有效方法。
目前我脑海中的一个直接方法是,首先我们从一组初始实例开始,并对其进行训练。然后每次模型做出错误预测时,我们将错误实例添加到训练集中。这与盲目扩大训练集不同,因为它更具有针对性。可以将其视为控制理论语言中的某种负反馈。
是否有任何关于反馈方法的研究正在进行?有没有人能够提供一些提示?