Merge pull request #7732 from JiayiFeng/refine_grad_clip_api

update gradient clip api

Merge pull request #7732 from JiayiFeng/refine_grad_clip_api
update gradient clip api
a173fa75 · fengjiayi · GitHub · 1575c2c8 · 5fc498e7 · a173fa75
隐藏空白更改
内联并排

Showing with 13 addition and 8 deletion

python/paddle/v2/fluid/clip.py python/paddle/v2/fluid/clip.py +11 -7

python/paddle/v2/fluid/tests/test_gradient_clip.py python/paddle/v2/fluid/tests/test_gradient_clip.py +2 -1

未找到文件。
--- a/python/paddle/v2/fluid/clip.py
+++ b/python/paddle/v2/fluid/clip.py
@@ -12,14 +12,18 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import copy
 import functools
 import layers
 import framework
 from . import core
 __all__ = [
-    'GradientClipByValue',
    'ErrorClipByValue',
+    'GradientClipByValue',
+    'GradientClipByNorm',
+    'GradientClipByGlobalNorm',
    'append_gradient_clip_ops',
    'error_clip_callback',
 ]
@@ -155,10 +159,11 @@ class GradientClipByGlobalNorm(BaseGradientClipAttr):
        return param, new_grad
-def gradient_clip_by_global_norm(clip_norm,
+def set_gradient_clip(clip, param_list=None, program=None):
-                                 param_list=None,
+    if not isinstance(clip, BaseGradientClipAttr):
-                                 group_name="default_group",
+        raise TypeError(
-                                 program=None):
+            "'clip' should be an instance of BaseGradientClipAttr's derived class"
+        )
    if program is None:
        program = framework.default_main_program()
    if param_list is None:
@@ -171,8 +176,7 @@ def gradient_clip_by_global_norm(clip_norm,
        )
    for param in param_list:
-        param.gradient_clip_attr = GradientClipByGlobalNorm(clip_norm,
+        param.gradient_clip_attr = copy.deepcopy(clip)
-                                                            group_name)
 def append_gradient_clip_ops(param_grad):

--- a/python/paddle/v2/fluid/tests/test_gradient_clip.py
+++ b/python/paddle/v2/fluid/tests/test_gradient_clip.py
@@ -40,7 +40,8 @@ p_g = fluid.backward.append_backward(loss=avg_cost)
 p_g_clip = fluid.backward.append_backward(loss=avg_cost_clip)
 with fluid.program_guard(main_program=prog_clip):
-    fluid.clip.gradient_clip_by_global_norm(clip_norm=CLIP)
+    fluid.clip.set_gradient_clip(
+        fluid.clip.GradientClipByGlobalNorm(clip_norm=CLIP))
    p_g_clip = fluid.clip.append_gradient_clip_ops(p_g_clip)
 grad_list = [elem[1] for elem in p_g]