matmul use fp32 compute_type (#8733)

4f735dbd · Zhang Ting · GitHub · bdfa1d2f · 4f735dbd
隐藏空白更改
内联并排

Showing with 3 addition and 2 deletion

tools/train.py tools/train.py +3 -2

未找到文件。
--- a/tools/train.py
+++ b/tools/train.py
@@ -152,9 +152,10 @@ def main(config, device, logger, vdl_writer):
        AMP_RELATED_FLAGS_SETTING = {'FLAGS_max_inplace_grad_add': 8, }
        if paddle.is_compiled_with_cuda():
            AMP_RELATED_FLAGS_SETTING.update({
-                'FLAGS_cudnn_batchnorm_spatial_persistent': 1
+                'FLAGS_cudnn_batchnorm_spatial_persistent': 1,
+                'FLAGS_gemm_use_half_precision_compute_type': 0,
            })
-        paddle.fluid.set_flags(AMP_RELATED_FLAGS_SETTING)
+        paddle.set_flags(AMP_RELATED_FLAGS_SETTING)
        scale_loss = config["Global"].get("scale_loss", 1.0)
        use_dynamic_loss_scaling = config["Global"].get(
            "use_dynamic_loss_scaling", False)