Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
042d1e7e
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
1 年多 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
042d1e7e
编写于
5月 24, 2023
作者:
G
gaotingquan
提交者:
cuicheng01
5月 26, 2023
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix layer key name for dynamic lr in adamwdl optimizer
上级
80ae9079
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
4 addition
and
1 deletion
+4
-1
ppcls/optimizer/optimizer.py
ppcls/optimizer/optimizer.py
+4
-1
未找到文件。
ppcls/optimizer/optimizer.py
浏览文件 @
042d1e7e
...
...
@@ -411,7 +411,10 @@ class AdamWDL(object):
idx
=
static_name
.
find
(
"blocks."
)
layer
=
int
(
static_name
[
idx
:].
split
(
"."
)[
1
])
ratio
=
decay_rate
**
(
n_layers
-
layer
)
elif
"embed"
in
static_name
:
elif
any
([
key
in
static_name
for
key
in
[
"embed"
,
"token"
,
"conv1"
,
"ln_pre"
]
]):
ratio
=
decay_rate
**
(
n_layers
+
1
)
# param.optimize_attr["learning_rate"] *= ratio
return
ratio
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录