fix RMSProp one_dim_param_no_weight_decay

b66ee638 · Yang Nie · Tingquan Gao · c351dac6 · b66ee638
隐藏空白更改
内联并排

Showing with 17 addition and 17 deletion

ppcls/optimizer/optimizer.py ppcls/optimizer/optimizer.py +17 -17

未找到文件。
--- a/ppcls/optimizer/optimizer.py
+++ b/ppcls/optimizer/optimizer.py
@@ -232,26 +232,26 @@ class RMSProp(object):
    def __call__(self, model_list):
        # model_list is None in static graph
        parameters = None
-        if len(self.no_weight_decay_name_list) > 0:
+        if model_list:
            params_with_decay = []
            params_without_decay = []
            for m in model_list:
-                params = [p for n, p in m.named_parameters() \
+                for n, p in m.named_parameters():
-                          if not any(nd in n for nd in self.no_weight_decay_name_list)]
+                    if any(nd in n for nd in self.no_weight_decay_name_list) \
-                params_with_decay.extend(params)
+                        or (self.one_dim_param_no_weight_decay and len(p.shape) == 1):
-                params = [p for n, p in m.named_parameters() \
+                        params_without_decay.append(p)
-                          if any(nd in n for nd in self.no_weight_decay_name_list) or (self.one_dim_param_no_weight_decay and len(p.shape) == 1)]
+                    else:
-                params_without_decay.extend(params)
+                        params_with_decay.append(p)
-            parameters = [{
+            if params_without_decay:
-                "params": params_with_decay,
+                parameters = [{
-                "weight_decay": self.weight_decay
+                    "params": params_with_decay,
-            }, {
+                    "weight_decay": self.weight_decay
-                "params": params_without_decay,
+                }, {
-                "weight_decay": 0.0
+                    "params": params_without_decay,
-            }]
+                    "weight_decay": 0.0
-        else:
+                }]
-            parameters = sum([m.parameters() for m in model_list],
+            else:
-                             []) if model_list else None
+                parameters = params_with_decay
        opt = optim.RMSProp(
            learning_rate=self.learning_rate,
            momentum=self.momentum,