fix dygraph adamw (#36745) (#36794)

e3db65d5 · zhaoyingli · GitHub · 0b7f43ec · e3db65d5 · e3db65d5
隐藏空白更改
内联并排

Showing with 3 addition and 4 deletion

python/paddle/fluid/tests/unittests/test_adamw_op.py python/paddle/fluid/tests/unittests/test_adamw_op.py +1 -1

python/paddle/optimizer/adamw.py python/paddle/optimizer/adamw.py +2 -3

未找到文件。
--- a/python/paddle/fluid/tests/unittests/test_adamw_op.py
+++ b/python/paddle/fluid/tests/unittests/test_adamw_op.py
@@ -333,7 +333,7 @@ class TestAdamWOpLayerwiseLR(TestAdamWOp):
            lr_ratio=simple_lr_fun)
        loss_ref = np.array(
-            [4.8383293, 3.0854003, 1.33299, -0.418993, -2.171043])
+            [4.8383293, 3.084947, 1.3323904, -0.41943002, -2.1710064])
        for i in range(5):
            a1 = linear1(a)
            out = linear2(a1)

--- a/python/paddle/optimizer/adamw.py
+++ b/python/paddle/optimizer/adamw.py
@@ -304,9 +304,8 @@ class AdamW(Adam):
                moment1, moment2, beta1_pow_acc, beta2_pow_acc, master_weight,
                'epsilon', self._epsilon, 'lazy_mode', self._lazy_mode,
                'min_row_size_to_use_multithread', 1000, 'beta1', _beta1,
-                'beta2', _beta2, 'coeff', self._coeff, 'multi_precision',
+                'beta2', _beta2, "with_decay", with_decay, 'coeff', self._coeff,
-                find_master, 'lr_ratio', lr_ratio_)
+                'multi_precision', find_master, 'lr_ratio', lr_ratio_)
            return None
        inputs = {