correct the LookaheadOptimizer programDesc, test=develop (#25688)

ea60e644 · mapingshuo · GitHub · b5f8784c · ea60e644
隐藏空白更改
内联并排

Showing with 46 addition and 42 deletion

python/paddle/fluid/optimizer.py python/paddle/fluid/optimizer.py +46 -42

未找到文件。
--- a/python/paddle/fluid/optimizer.py
+++ b/python/paddle/fluid/optimizer.py
@@ -4884,48 +4884,52 @@ class LookaheadOptimizer(object):
                inputs={"X": fast_var},
                outputs={"Out": slow_var})
-        # Add Var k to main prog and startup prog
+        with framework.program_guard(main_block.program, startup_program):
-        k = layers.create_global_var(
+            # Add Var k to main prog and startup prog
-            name="lookahead_k",
+            k = layers.create_global_var(
-            shape=[1],
+                name="lookahead_k",
-            value=int(self.k),
+                shape=[1],
-            dtype='int32',
+                value=int(self.k),
-            persistable=True)
+                dtype='int32',
+                persistable=True)
-        # Add Var alpha to main prog and startup prog
+            # Add Var alpha to main prog and startup prog
-        alpha = layers.create_global_var(
+            alpha = layers.create_global_var(
-            name="lookahead_alpha",
+                name="lookahead_alpha",
-            shape=[1],
+                shape=[1],
-            value=float(self.alpha),
+                value=float(self.alpha),
-            dtype='float32',
+                dtype='float32',
-            persistable=True)
+                persistable=True)
-        # Add Var step
+            # Add Var step
-        step = layers.create_global_var(
+            step = layers.create_global_var(
-            name="lookahead_step",
+                name="lookahead_step",
-            shape=[1],
+                shape=[1],
-            value=int(0),
+                value=int(0),
-            dtype='int32',
+                dtype='int32',
-            persistable=True)
+                persistable=True)
-        layers.increment(x=step, value=1.0, in_place=True)
+            layers.increment(x=step, value=1.0, in_place=True)
-        # lookahead
+            # lookahead
-        zero_var = layers.fill_constant(shape=[1], dtype='float32', value=0.0)
+            zero_var = layers.fill_constant(
+                shape=[1], dtype='float32', value=0.0)
-        one_var = layers.fill_constant(shape=[1], dtype='float32', value=1.0)
+            one_var = layers.fill_constant(
-        mod = layers.elementwise_mod(step, k)
+                shape=[1], dtype='float32', value=1.0)
-        with layers.control_flow.Switch() as switch:
-            with switch.case(mod == zero_var):
+            mod = layers.elementwise_mod(step, k)
-                for param_name in params:
+            with layers.control_flow.Switch() as switch:
-                    fast_var = main_block.var(param_name)
+                with switch.case(mod == zero_var):
-                    slow_var = param_to_slow[param_name]
+                    for param_name in params:
-                    tmp_var = layers.elementwise_add(
+                        fast_var = main_block.var(param_name)
-                        layers.elementwise_mul(fast_var, alpha),
+                        slow_var = param_to_slow[param_name]
-                        layers.elementwise_mul(
+                        tmp_var = layers.elementwise_add(
-                            slow_var, layers.elementwise_sub(one_var, alpha)))
+                            layers.elementwise_mul(fast_var, alpha),
-                    layers.assign(input=tmp_var, output=slow_var)
+                            layers.elementwise_mul(
-                    layers.assign(input=tmp_var, output=fast_var)
+                                slow_var,
-            with switch.default():
+                                layers.elementwise_sub(one_var, alpha)))
-                pass
+                        layers.assign(input=tmp_var, output=slow_var)
+                        layers.assign(input=tmp_var, output=fast_var)
+                with switch.default():
+                    pass
        return mini_out