not dump all grad info, since slow down train porcess

f0470e05 · Hui Zhang · 8fef667f · f0470e05
隐藏空白更改
内联并排

Showing with 9 addition and 7 deletion

deepspeech/training/gradclip.py deepspeech/training/gradclip.py +9 -7

未找到文件。
--- a/deepspeech/training/gradclip.py
+++ b/deepspeech/training/gradclip.py
@@ -47,9 +47,10 @@ class ClipGradByGlobalNormWithLog(paddle.nn.ClipGradByGlobalNorm):
            sum_square = layers.reduce_sum(square)
            sum_square_list.append(sum_square)
-            # debug log
+            # debug log, not dump all since slow down train process
-            logger.debug(
+            if i < 10:
-                f"Grad Before Clip: {p.name}: {float(sum_square.sqrt()) }")
+                logger.debug(
+                    f"Grad Before Clip: {p.name}: {float(sum_square.sqrt()) }")
        # all parameters have been filterd out
        if len(sum_square_list) == 0:
@@ -75,9 +76,10 @@ class ClipGradByGlobalNormWithLog(paddle.nn.ClipGradByGlobalNorm):
            new_grad = layers.elementwise_mul(x=g, y=clip_var)
            params_and_grads.append((p, new_grad))
-            # debug log
+            # debug log, not dump all since slow down train process
-            logger.debug(
+            if i < 10:
-                f"Grad After Clip: {p.name}: {float(new_grad.square().sum().sqrt())}"
+                logger.debug(
-            )
+                    f"Grad After Clip: {p.name}: {float(new_grad.square().sum().sqrt())}"
+                )
        return params_and_grads