在lightGBM模型中,有两个与bagging相关的参数。
bagging_fraction
bagging_freq (frequency for bagging
0 means disable bagging; k means perform bagging at every k
iteration
Note: to enable bagging, bagging_fraction should be set to
value smaller than 1.0 as well)
我在gdbt中找到了一些有关这个装袋函数的更详细解释,所以有没有人能给我一个更详细的解释呢?
bagging_freq=1
和bagging_freq=<你的模型中树的数量>
,那么后者会导致更多的过拟合。然而,这并不意味着参数的微小差异会带来很大的优势,例如,bagging_freq=2
的模型比bagging_freq=1
的模型更容易过拟合。只要bagging_freq << <你的模型中树的数量>
,你就应该没问题了。 - Mischa Lisovyi