update fetch kernel

a1f40a2c · zhaojiaying01 · 71a1cf75 · a1f40a2c · a1f40a2c · a1f40a2c
Showing with 5 addition and 13 deletion

src/framework/executor.cpp src/framework/executor.cpp +2 -12

src/framework/operator.cpp src/framework/operator.cpp +1 -1

src/operators/kernel/cl/fetch_kernel.cpp src/operators/kernel/cl/fetch_kernel.cpp +2 -0

未找到文件。
--- a/src/framework/executor.cpp
+++ b/src/framework/executor.cpp
@@ -922,12 +922,7 @@ void Executor<GPU_CL, Precision::FP32>::InitMemory() {
      if (var_desc->Persistable()) {
        CLImage *cl_image = nullptr;
        if (var_desc->Name() == "feed" || var_desc->Name() == "fetch") {
-          auto tensor = var->template GetMutable<framework::LoDTensor>();
-          if (var_desc->Name() == "fetch") {
-            const framework::TensorDesc &desc = var_desc->Tensor_desc();
-            framework::DDim ddim = framework::make_ddim(desc.Dims());
-            tensor->mutable_data<float>(ddim);
-          }
+          var->template GetMutable<framework::LoDTensor>();
          continue;
        } else {
          cl_image = var->template GetMutable<framework::CLImage>();
@@ -991,12 +986,7 @@ void Executor<GPU_CL, Precision::FP32>::InitCombineMemory() {
      if (var_desc->Persistable()) {
        CLImage *cl_image = nullptr;
        if (var_desc->Name() == "feed" || var_desc->Name() == "fetch") {
-          auto tensor = var->template GetMutable<framework::LoDTensor>();
-          if (var_desc->Name() == "fetch") {
-            const framework::TensorDesc &desc = var_desc->Tensor_desc();
-            framework::DDim ddim = framework::make_ddim(desc.Dims());
-            tensor->mutable_data<float>(ddim);
-          }
+          var->template GetMutable<framework::LoDTensor>();
          continue;
        } else {
          cl_image = var->template GetMutable<framework::CLImage>();

--- a/src/framework/operator.cpp
+++ b/src/framework/operator.cpp
@@ -95,7 +95,7 @@ void OperatorBase<Dtype>::Run() {
        if (type_ == "fetch") {
          Tensor *tensor = vari->template GetMutable<framework::LoDTensor>();
          if (tensor) {
-            DLOG << type_ << " output- " << key << "=" << tensor->dims();
+            DLOG << type_ << " output- " << key << "=" << *tensor;
          }
        } else {
          CLImage *cl_image = vari->template GetMutable<framework::CLImage>();

--- a/src/operators/kernel/cl/fetch_kernel.cpp
+++ b/src/operators/kernel/cl/fetch_kernel.cpp
@@ -21,6 +21,8 @@ namespace operators {
 template <>
 bool FetchKernel<GPU_CL, float>::Init(FetchParam<GPU_CL> *param) {
  this->cl_helper_.AddKernel("fetch", "fetch_kernel.cl");
+  auto *out = param->Out();
+  out->mutable_data<float>();
  return true;
 }