fix layer key name for dynamic lr in adamwdl optimizer

042d1e7e · gaotingquan · cuicheng01 · 80ae9079 · 042d1e7e
隐藏空白更改
内联并排

Showing with 4 addition and 1 deletion

ppcls/optimizer/optimizer.py ppcls/optimizer/optimizer.py +4 -1

未找到文件。
--- a/ppcls/optimizer/optimizer.py
+++ b/ppcls/optimizer/optimizer.py
@@ -411,7 +411,10 @@ class AdamWDL(object):
                idx = static_name.find("blocks.")
                layer = int(static_name[idx:].split(".")[1])
                ratio = decay_rate**(n_layers - layer)
-            elif "embed" in static_name:
+            elif any([
+                    key in static_name
+                    for key in ["embed", "token", "conv1", "ln_pre"]
+            ]):
                ratio = decay_rate**(n_layers + 1)
            # param.optimize_attr["learning_rate"] *= ratio
            return ratio