reconstruct code for convert_fp16 (#46428) (#47087)

de6f15b6 · Wilber · GitHub · 2cc8797e · de6f15b6 · de6f15b6
3 changed file
--- a/paddle/fluid/inference/analysis/passes/convert_to_mixed_precision.cc
+++ b/paddle/fluid/inference/analysis/passes/convert_to_mixed_precision.cc
--- a/paddle/fluid/inference/analysis/passes/convert_to_mixed_precision.h
+++ b/paddle/fluid/inference/analysis/passes/convert_to_mixed_precision.h
@@ -30,7 +30,7 @@ namespace paddle {
 namespace inference {
 namespace analysis {
-bool OpSupportPrecision(const std::string& phi_op_type,
+bool OpSupportPrecision(const std::string& op_type,
                        phi::Backend backend,
                        phi::DataType precision,
                        const std::unordered_set<std::string>& blacklist);

--- a/paddle/fluid/inference/analysis/passes/ir_params_sync_among_devices_pass.cc
+++ b/paddle/fluid/inference/analysis/passes/ir_params_sync_among_devices_pass.cc
@@ -140,39 +140,12 @@ void IrParamsSyncAmongDevicesPass::CopyParamsToGpu(Argument *argument) {
        auto var_data_type = var_node->Var()->GetDataType();
        VLOG(5) << "var_name is " << var_name << ", data type is "
                << var_data_type;
-        if (var_data_type == paddle::framework::proto::VarType::FP16 &&
+        platform::CPUPlace cpu_place;
-            t->dtype() != paddle::experimental::DataType::FLOAT16) {
+        framework::LoDTensor temp_tensor;
-          framework::Tensor half_tensor;
+        temp_tensor.Resize(t->dims());
-          half_tensor.set_type(paddle::experimental::DataType::FLOAT16);
+        paddle::framework::TensorCopySync(*t, cpu_place, &temp_tensor);
-          half_tensor.Resize(t->dims());
+        t->clear();
-          auto *half_data =
+        paddle::framework::TensorCopySync(temp_tensor, place, t);
-              half_tensor.mutable_data<float16>(platform::CPUPlace());
-          for (int i = 0; i < t->numel(); i++) {
-            auto *data = t->mutable_data<float16>(platform::CPUPlace());
-            half_data[i] = static_cast<float16>(data[i]);
-          }
-          t->clear();
-          paddle::framework::TensorCopySync(half_tensor, place, t);
-        } else if (var_data_type == paddle::framework::proto::VarType::BF16) {
-          framework::Tensor bf16_tensor;
-          bf16_tensor.set_type(paddle::experimental::DataType::BFLOAT16);
-          bf16_tensor.Resize(t->dims());
-          auto *bf16_data = bf16_tensor.mutable_data<platform::bfloat16>(
-              platform::CPUPlace());
-          for (int i = 0; i < t->numel(); i++) {
-            auto *data = t->mutable_data<bfloat16>(platform::CPUPlace());
-            bf16_data[i] = static_cast<platform::bfloat16>(data[i]);
-          }
-          t->clear();
-          paddle::framework::TensorCopySync(bf16_tensor, place, t);
-        } else {
-          platform::CPUPlace cpu_place;
-          framework::LoDTensor temp_tensor;
-          temp_tensor.Resize(t->dims());
-          paddle::framework::TensorCopySync(*t, cpu_place, &temp_tensor);
-          t->clear();
-          paddle::framework::TensorCopySync(temp_tensor, place, t);
-        }
      }
    }
  }