在第三课-行星中,我看到了这两行代码:
如果使用slice(min_lr, max_lr),那么我理解fit_one_cycle()将使用来自slice(min_lr, max_lr)的分散学习率。(希望我的理解是正确的)
但在这种情况下,slice(lr)只有一个参数,
fit_one_cycle(5, lr)和fit_one_cycle(5, slice(lr))之间有什么区别?
使用slice(lr)而不是直接使用lr有什么好处?
lr = 0.01
learn.fit_one_cycle(5, slice(lr))
如果使用slice(min_lr, max_lr),那么我理解fit_one_cycle()将使用来自slice(min_lr, max_lr)的分散学习率。(希望我的理解是正确的)
但在这种情况下,slice(lr)只有一个参数,
fit_one_cycle(5, lr)和fit_one_cycle(5, slice(lr))之间有什么区别?
使用slice(lr)而不是直接使用lr有什么好处?