Pytorch 常用学习率变化方式小结

学习率走廊

lr_scheduler.LambdaLR(optimizer,lr_lamda,last_epoch=-1,verbose=False)

optimizer: 优化器

lr_lambda:函数或者函数列表

last_epoch：默认为-1，学习率更新次数计数；注意断点训练时last_epoch不为-1

当last_epoch 是-1的时候，base_lr 就是optimizer中的lr。

新的学习率new_lr=lr_lambda(last_epoch)*base_lr

lr_lambda=lambda epoch：epoch/10

lr_lambda=lambda epoch: epoch/2-0.001

每次执行scheduler.step()，last_epoch=last_epoch+1

lr_scheduler.MultiplicativeLR(optimizer, lr_lambda, last_epoch=- 1, verbose=False)

optimizer: 优化器

lr_lambda:函数或者函数列表

last_epoch：默认为-1，学习率更新次数计数；注意断点训练时last_epoch不为-1

当last_epoch 是-1的时候，base_lr 就是optimizer中的lr。

新的学习率new_lr=lr_lambda(last_epoch)*base_lr

lr_lambda=lambda epoch：epoch/10 函数只能是乘性因子。

每次执行scheduler.step()，last_epoch=last_epoch+1

lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=- 1, verbose=False)

optimizer: 优化器

lr_lambda:函数或者函数列表

gamma: 每一次更新学习率的乘性因子

last_epoch：默认为-1，学习率更新次数计数；注意断点训练时last_epoch不为-1

当last_epoch 是-1的时候，base_lr 就是optimizer中的lr。

新的学习率new_lr=gamma*base_lr

每step_size个epoch，学习率更新一次

每次执行scheduler.step()，last_epoch=last_epoch+1

lr_scheduler.MultiStepLR(optimizer, milestones, gamma=0.1, last_epoch=- 1, verbose=False)

milestones 存储需要更新学习率的epoch，是一个list

gamma: 每次更新学习率的乘性因子

# Assuming optimizer uses lr = 0.05 for all groups>

milestones=[30,80]

>> # lr = 0.05 if epoch < 30

>>> # lr = 0.005 if 30 <= epoch < 80

>>> # lr = 0.0005 if epoch >= 80

lr_scheduler.ExponentialLR(optimizer, gamma, last_epoch=- 1, verbose=False)

new_lr = base_lr*exp(gamma)

学习率是每个epoch都更新。

lr_scheduler.ConstantLR(optimizer, factor=0.3333333333333333, total_iters=5, last_epoch=- 1, verbose=False)

当epoch不大于total_iters时，学习率更新公式为 new_lr = base_lr*factor

当epoch大于total_iters 时候，学习率重新恢复为base_lr

>>> # Assuming optimizer uses lr = 0.05 for all groups

>>> # lr = 0.025 if epoch == 0

>>> # lr = 0.025 if epoch == 1

>>> # lr = 0.025 if epoch == 2

>>> # lr = 0.025 if epoch == 3>>> # lr = 0.05 if epoch >= 4

>>> scheduler=ConstantLR(self.opt,factor=0.5,total_iters=4)

>>> for epoch in range(100):

>>> train(...)

>>> validate(...)

>>> scheduler.step()

lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, threshold=0.0001, threshold_mode='rel', cooldown=0, min_lr=0, eps=1e-08, verbose=False)

mode: 判断metric 降低还是升高的时候，对学习率更新更新，默认是metric降低的时候。mode='min'

学习率更新的公式： new_lr = base_lr *factor

patience: 当metric 超出多少个epoch（patience）以后，还是没有显著的降低的话，对学习率进行调整。

如果verbose是True的话。那么标准打印出更新的学习率信息。

min_lr：最小学习率下限。

optim.lr_scheduler.CyclicLR(optimizer, base_lr, max_lr, step_size_up=2000, step_size_down=None, mode='triangular', gamma=1.0, scale_fn=None, scale_mode='cycle', cycle_momentum=True, base_momentum=0.8, max_momentum=0.9, last_epoch=- 1, verbose=False)

base_lr：基础学习率

max_lr：学习率上限

step_size_up：学习率上升的步数

step_size_down：学习率下降的步数

mode：共三种模式分别为triangular，triangular2和exp_range

gamma：exp_range中的常量gamma**(cycle iterations)

scale_fn：自定义缩放策略保证所有x ≥ 0 x\geq 0x≥0的情况下s c a l e _ f n ( x ) scale\_fn(x)scale_fn(x)的值域为[ 0 , 1 ] [0,1][0,1]

scale_mode：两种模式cycle和iterations cycle_momentum：如果为True，则动量与’base_momentum’和’max_momentum之间的学习率成反比

base_momentum：初始动量，即每个参数组的循环中的下边界。

max_momentum：每个参数组的循环中的上动量边界。

lr 是每一个更新的步长是按照batch来划分的。

小结

一般地，在实际应用中经常会使用lr_scheduler.ReduceLROnPlateau 用于监控validation loss 有无降低，从而优化学习率，对于其他的优化scheduler，并无根据metric来调整学习率的机制，主要采用步长的方式来判断是否需要来更新学习率。

更新学习率的注意事项：

optimizer.step() 在scheduler.step() 之前，不然会导致学习率混乱的状态。一般是以下面的形式出现，更新学习率。

>>> for epoch in range(100):

>>> train(...)

>>> validate(...)

>>> scheduler.step()

最后编辑于：2021.11.17 19:42:37

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,843评论 6赞 502
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,538评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,187评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,264评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,289评论 6赞 390
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,231评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,116评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,945评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,367评论 1赞 313
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,581评论 2赞 333
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,754评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,458评论 5赞 344
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,068评论 3赞 327
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,692评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,842评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,797评论 2赞 369
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,654评论 2赞 354

Pytorch 常用学习率变化方式小结

学习率走廊

小结

推荐阅读更多精彩内容