[Paddle-Inference] fix_qkv_plugin: fix half scale (#37096)

* fix_qkv_plugin: half_scale * [Paddle-Inference] fix_qkv_plugin: fix half scale

[Paddle-Inference] fix_qkv_plugin: fix half scale (#37096)
* fix_qkv_plugin: half_scale * [Paddle-Inference] fix_qkv_plugin: fix half scale
36154ba9 · Wangzheee · GitHub · 9574bcd7 · 36154ba9
隐藏空白更改
内联并排

Showing with 3 addition and 1 deletion

paddle/fluid/inference/tensorrt/plugin/qkv_to_context_plugin.cu .../fluid/inference/tensorrt/plugin/qkv_to_context_plugin.cu +3 -1

未找到文件。
--- a/paddle/fluid/inference/tensorrt/plugin/qkv_to_context_plugin.cu
+++ b/paddle/fluid/inference/tensorrt/plugin/qkv_to_context_plugin.cu
@@ -229,7 +229,9 @@ template <typename T>
 __global__ void apply_scale(T *data, T scale, int n) {
 #if CUDA_ARCH_FP16_SUPPORTED(__CUDA_ARCH__)
  int tid = blockIdx.x * blockDim.x + threadIdx.x;
-  data[tid] = data[tid] * scale;
+  if (tid < n) {
+    data[tid] = data[tid] * scale;
+  }
 #endif
 }