not dump all grad info, since slow down train porcess

f0470e05 · Hui Zhang · 8fef667f · f0470e05
显示空白变更内容
内联并排

Showing with 9 addition and 7 deletion

deepspeech/training/gradclip.py deepspeech/training/gradclip.py +9 -7

未找到文件。
--- a/deepspeech/training/gradclip.py
+++ b/deepspeech/training/gradclip.py
@@ -47,7 +47,8 @@ class ClipGradByGlobalNormWithLog(paddle.nn.ClipGradByGlobalNorm):
            sum_square = layers.reduce_sum(square)
            sum_square_list.append(sum_square)
-            # debug log
+            # debug log, not dump all since slow down train process
+            if i < 10:
                logger.debug(
                    f"Grad Before Clip: {p.name}: {float(sum_square.sqrt()) }")
@@ -75,7 +76,8 @@ class ClipGradByGlobalNormWithLog(paddle.nn.ClipGradByGlobalNorm):
            new_grad = layers.elementwise_mul(x=g, y=clip_var)
            params_and_grads.append((p, new_grad))
-            # debug log
+            # debug log, not dump all since slow down train process
+            if i < 10:
                logger.debug(
                    f"Grad After Clip: {p.name}: {float(new_grad.square().sum().sqrt())}"
                )