fix bug when beta1_pow on cpu (#31995)

44ed8f2d · Leo Chen · GitHub · bc7a3afa · 44ed8f2d
隐藏空白更改
内联并排

Showing with 14 addition and 2 deletion

paddle/fluid/operators/optimizers/adam_op_npu.cc paddle/fluid/operators/optimizers/adam_op_npu.cc +14 -2

未找到文件。
--- a/paddle/fluid/operators/optimizers/adam_op_npu.cc
+++ b/paddle/fluid/operators/optimizers/adam_op_npu.cc
@@ -61,8 +61,20 @@ class AdamNPUKernel : public framework::OpKernel<T> {
    param_out->mutable_data<T>(ctx.GetPlace());
    mom1_out->mutable_data<T>(ctx.GetPlace());
    mom2_out->mutable_data<T>(ctx.GetPlace());
-    beta1_pow_out->mutable_data<T>(ctx.GetPlace());
-    beta2_pow_out->mutable_data<T>(ctx.GetPlace());
+    // NOTE(zhiqiu): beta1_pow and beta2_pow may on CPU and not transform place.
+    if (beta1_pow->place() == platform::CPUPlace()) {
+      float beta1 = *beta1_pow->data<float>();
+      beta1_pow_out->mutable_data<T>(ctx.GetPlace());
+      TensorFromVector(std::vector<float>{beta1}, ctx.device_context(),
+                       beta1_pow_out);
+    }
+    if (beta2_pow->place() == platform::CPUPlace()) {
+      float beta2 = *beta2_pow->data<float>();
+      beta2_pow_out->mutable_data<T>(ctx.GetPlace());
+      TensorFromVector(std::vector<float>{beta2}, ctx.device_context(),
+                       beta2_pow_out);
+    }
    T beta1 = static_cast<T>(ctx.Attr<float>("beta1"));
    if (ctx.HasInput("Beta1Tensor")) {