当前位置:   article > 正文

深度学习中不同学习率调整策略

深度学习中不同学习率调整策略

1、StepLR

功能:固定等间隔调整学习率

主要参数:
step_size:调整间隔数
gamma:调整系数

调整方式:
l r = l r ∗ g a m m a lr=lr\ast gamma lr=lrgamma

在这里插入图片描述

2、MultiStepLR

功能:按给定间隔调整学习率

主要参数:
milestones:设定调整的时刻数
gamma:调整系数

调整方式:
l r = l r ∗ g a m m a lr=lr\ast gamma lr=lrgamma

在这里插入图片描述

3、ExponentialLR

功能:按指数衰减调整学习率

主要参数:
gamma:指数的底

调整方式:
l r = l r ∗ g a m m a e p o c h lr=lr\ast gamma^{epoch} lr=lrgammaepoch
在这里插入图片描述

4、CosineAnnealingLR

功能:预弦周期调整学习率

主要参数:
T_max:下降周期
eta_min:学习率下限

调整方式:
η t = η m i n + 1 2 ( η m a x − η m i n ) ( 1 + cos ⁡ T c u r T m a x Π ) \eta _{t} =\eta _{min}+\frac{1}{2} \left (\eta _{max} -\eta _{min}\right ) \left ( 1+\cos \frac{T_{cur} }{T_{max} }\Pi \right ) ηt=ηmin+21(ηmaxηmin)(1+cosTmaxTcurΠ)

在这里插入图片描述
这里的T_max是以epoch为单位的,T_max对于余弦函数学习率的半周期(下降的半周期)

在这里插入图片描述

5、LinearLR

主要参数:
start_factor:起始factor
end_factor:终止factor

LinearLR是线性学习率,给定起始factor和最终的factor,LinearLR会在中间阶段做线性插值,比如学习率为0.1,起始factor为1,最终的factor为0.1。那么刚开始迭代时,学习率将为0.1,最终轮学习率为0.01。下面设置的总轮数total_iters为80,所以超过80时,学习率恒为0.01。

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/349714
推荐阅读
相关标签
  

闽ICP备14008679号