[NPU] Fix bug: Fix calculation errors of pow grad npu kernel (#31699)

e4247120 · liym27 · GitHub · 7ec8459c · e4247120
显示空白变更内容
内联并排

Showing with 11 addition and 20 deletion

paddle/fluid/operators/activation_op_npu.cc paddle/fluid/operators/activation_op_npu.cc +11 -20

未找到文件。
--- a/paddle/fluid/operators/activation_op_npu.cc
+++ b/paddle/fluid/operators/activation_op_npu.cc
@@ -92,7 +92,7 @@ class PowGradNPUKernel : public framework::OpKernel<T> {
    Tensor x_power_mul_factor(x->type());
    x_power_mul_factor.mutable_data<T>(x->dims(), place);
    auto runner_mul_1 =
-        NpuOpRunner("Mul", {factor_bc_tensor, *x}, {x_power_mul_factor}, {});
+        NpuOpRunner("Mul", {factor_bc_tensor, x_pow}, {x_power_mul_factor}, {});
    runner_mul_1.Run(stream);
    // Step 4: Compute dx = dout * factor * x.pow(factor-1)
@@ -309,20 +309,17 @@ class SquareNPUKernel : public framework::OpKernel<T> {
 namespace ops = paddle::operators;
 REGISTER_OP_NPU_KERNEL(
-    pow,
+    pow, ops::PowNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::PowNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::PowNPUKernel<paddle::platform::NPUDeviceContext,
                      paddle::platform::float16>);
 REGISTER_OP_NPU_KERNEL(
-    pow_grad,
+    pow_grad, ops::PowGradNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::PowGradNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::PowGradNPUKernel<paddle::platform::NPUDeviceContext,
                          paddle::platform::float16>);
 REGISTER_OP_NPU_KERNEL(
-    relu,
+    relu, ops::ReluNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::ReluNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::ReluNPUKernel<paddle::platform::NPUDeviceContext,
                       paddle::platform::float16>);
@@ -333,8 +330,7 @@ REGISTER_OP_NPU_KERNEL(
                           paddle::platform::float16>);
 REGISTER_OP_NPU_KERNEL(
-    sqrt,
+    sqrt, ops::SqrtNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::SqrtNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::SqrtNPUKernel<paddle::platform::NPUDeviceContext,
                       paddle::platform::float16>);
@@ -345,21 +341,17 @@ REGISTER_OP_NPU_KERNEL(
                           paddle::platform::float16>);
 REGISTER_OP_NPU_KERNEL(
-    log,
+    log, ops::LogNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::LogNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::LogNPUKernel<paddle::platform::NPUDeviceContext,
                      paddle::platform::float16>);
 REGISTER_OP_NPU_KERNEL(
-    log_grad,
+    log_grad, ops::LogGradNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::LogGradNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::LogGradNPUKernel<paddle::platform::NPUDeviceContext,
                          paddle::platform::float16>);
 REGISTER_OP_NPU_KERNEL(
-    tanh,
+    tanh, ops::TanhNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::TanhNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::TanhNPUKernel<paddle::platform::NPUDeviceContext,
                       paddle::platform::float16>);
@@ -370,7 +362,6 @@ REGISTER_OP_NPU_KERNEL(
                           paddle::platform::float16>);
 REGISTER_OP_NPU_KERNEL(
-    square,
+    square, ops::SquareNPUKernel<paddle::platform::NPUDeviceContext, float>,
-    ops::SquareNPUKernel<paddle::platform::NPUDeviceContext, float>,
    ops::SquareNPUKernel<paddle::platform::NPUDeviceContext,
                         paddle::platform::float16>);