fix(mge/optimizer): fix optimizer update step inplace add grad

GitOrigin-RevId: d677d1ca6b37bf94b89305a6102d2f1a11d6c872

fix(mge/optimizer): fix optimizer update step inplace add grad
GitOrigin-RevId: d677d1ca6b37bf94b89305a6102d2f1a11d6c872
e9d6361e · Megvii Engine Team · a3e098c8 · e9d6361e · e9d6361e · e9d6361e
4 changed file
--- a/imperative/python/megengine/optimizer/adadelta.py
+++ b/imperative/python/megengine/optimizer/adadelta.py
@@ -84,7 +84,7 @@ class Adadelta(Optimizer):
            step += c1
            grad = param.grad
            if weight_decay != 0.0:
-                grad += param * _weight_decay
+                grad = grad + param * _weight_decay
            square_avg = states["square_avg"]
            acc_delta = states["acc_delta"]

--- a/imperative/python/megengine/optimizer/adagrad.py
+++ b/imperative/python/megengine/optimizer/adagrad.py
@@ -82,7 +82,7 @@ class Adagrad(Optimizer):
            step += c1
            grad = param.grad
            if weight_decay != 0.0:
-                grad += param * _weight_decay
+                grad = grad + param * _weight_decay
            square_avg = states["square_avg"]
            square_avg += grad ** c2

--- a/imperative/python/megengine/optimizer/adam.py
+++ b/imperative/python/megengine/optimizer/adam.py
@@ -85,7 +85,7 @@ class Adam(Optimizer):
            grad = param.grad
            if weight_decay != 0.0:
-                grad += param * _weight_decay
+                grad = grad + param * _weight_decay
            states = self._state[param]

--- a/imperative/python/megengine/optimizer/sgd.py
+++ b/imperative/python/megengine/optimizer/sgd.py
@@ -72,7 +72,7 @@ class SGD(Optimizer):
            grad = param.grad
            if weight_decay != 0.0:
-                grad += param * _weight_decay
+                grad = grad + param * _weight_decay
            if inplace_mode:
                if momentum: