add fuse_multi_transformer passes to fp16. test=develop (#47733)

34f67a88 · Kaipeng Deng · GitHub · b3e45714 · 34f67a88
显示空白变更内容
内联并排

Showing with 6 addition and 0 deletion

paddle/fluid/inference/api/paddle_pass_builder.cc paddle/fluid/inference/api/paddle_pass_builder.cc +6 -0

未找到文件。
--- a/paddle/fluid/inference/api/paddle_pass_builder.cc
+++ b/paddle/fluid/inference/api/paddle_pass_builder.cc
@@ -163,6 +163,12 @@ const std::vector<std::string> kGpuLowerPrecisionPasses{
    "conv_elementwise_add2_act_fuse_pass",
    "conv_elementwise_add_fuse_pass",
    "multihead_matmul_fuse_pass_v2",
+    "fused_multi_transformer_encoder_pass",
+    "fused_multi_transformer_decoder_pass",
+    "fused_multi_transformer_encoder_fuse_qkv_pass",
+    "fused_multi_transformer_decoder_fuse_qkv_pass",
+    "multi_devices_fused_multi_transformer_encoder_fuse_qkv_pass",
+    "multi_devices_fused_multi_transformer_decoder_fuse_qkv_pass",
    "gpu_cpu_map_matmul_v2_to_mul_pass",
    "gpu_cpu_map_matmul_v2_to_matmul_pass",
    "fc_fuse_pass",