Enanle gradient clip in dam (#1452)

* Enanle gradient clip in dam * print memory optimization

Enanle gradient clip in dam (#1452)
* Enanle gradient clip in dam * print memory optimization
2c4a77ed · Yibing Liu · GitHub · 6290b4dd · 2c4a77ed
隐藏空白更改
内联并排

Showing with 4 addition and 2 deletion

fluid/PaddleNLP/deep_attention_matching_net/train_and_evaluate.py ...ddleNLP/deep_attention_matching_net/train_and_evaluate.py +4 -2

未找到文件。
--- a/fluid/PaddleNLP/deep_attention_matching_net/train_and_evaluate.py
+++ b/fluid/PaddleNLP/deep_attention_matching_net/train_and_evaluate.py
@@ -206,8 +206,8 @@ def train(args):
            loss.persistable = True
            logits.persistable = True
            # gradient clipping
-            #fluid.clip.set_gradient_clip(clip=fluid.clip.GradientClipByValue(
+            fluid.clip.set_gradient_clip(clip=fluid.clip.GradientClipByValue(
-            #    max=1.0, min=-1.0))
+                max=1.0, min=-1.0))
            optimizer = fluid.optimizer.Adam(
                learning_rate=fluid.layers.exponential_decay(
@@ -216,7 +216,9 @@ def train(args):
                    decay_rate=0.9,
                    staircase=True))
            optimizer.minimize(loss)
+            print("begin memory optimization ...")
            fluid.memory_optimize(train_program)
+            print("end memory optimization ...")
    test_program = fluid.Program()
    test_startup = fluid.Program()