fix fused_multi_transformer compile failed in cuda arch < sm53 (#42315)

f4507974 · WangXi · GitHub · 2e1fb26b · f4507974
隐藏空白更改
内联并排

Showing with 5 addition and 0 deletion

paddle/fluid/operators/fused/fused_multi_transformer_op.cu paddle/fluid/operators/fused/fused_multi_transformer_op.cu +5 -0

未找到文件。
--- a/paddle/fluid/operators/fused/fused_multi_transformer_op.cu
+++ b/paddle/fluid/operators/fused/fused_multi_transformer_op.cu
@@ -534,6 +534,8 @@ template <typename T, int Dh, int THREADS_PER_KEY, int THREADS_PER_VALUE,
          int THREADS_PER_BLOCK>
 __global__ void masked_multihead_attention_kernel(
    Masked_multihead_attention_params<T> params) {
+#if CUDA_ARCH_FP16_SUPPORTED(__CUDA_ARCH__)
+
  static_assert(Dh % THREADS_PER_KEY == 0, "");
  static_assert(Dh % THREADS_PER_VALUE == 0, "");

@@ -821,6 +823,9 @@ __global__ void masked_multihead_attention_kernel(
    printf("\n");
  }
 #endif
+#else
+  assert(false);
+#endif
 }

 template <typename T>