use CudnnHolder in conv_transpose_cudnn_op

d5f74b73 · fengjiayi · 15cc9128 · d5f74b73
显示空白变更内容
内联并排

Showing with 4 addition and 13 deletion

paddle/fluid/operators/conv_transpose_cudnn_op.cu.cc paddle/fluid/operators/conv_transpose_cudnn_op.cu.cc +4 -13

未找到文件。
--- a/paddle/fluid/operators/conv_transpose_cudnn_op.cu.cc
+++ b/paddle/fluid/operators/conv_transpose_cudnn_op.cu.cc
@@ -100,9 +100,8 @@ class CUDNNConvTransposeOpKernel : public framework::OpKernel<T> {
            handle, cudnn_filter_desc, cudnn_input_desc, cudnn_conv_desc,
            cudnn_output_desc, algo, &workspace_size_in_bytes));
-    // Allocate on GPU memory
+    // Get cudnn workspace
-    platform::CUDAPlace gpu = boost::get<platform::CUDAPlace>(ctx.GetPlace());
+    cudnn_workspace = dev_ctx.cudnn_workspace(workspace_size_in_bytes);
-    cudnn_workspace = paddle::memory::Alloc(gpu, workspace_size_in_bytes);
    // ------------------- cudnn conv transpose forward ---------------------
    int input_offset = input->numel() / input->dims()[0] / groups;
@@ -116,9 +115,6 @@ class CUDNNConvTransposeOpKernel : public framework::OpKernel<T> {
          algo, cudnn_workspace, workspace_size_in_bytes, &beta,
          cudnn_output_desc, output_data + output_offset * g));
    }
-    // Release the cudnn workspace
-    paddle::memory::Free(gpu, cudnn_workspace);
  }
 };
@@ -207,10 +203,8 @@ class CUDNNConvTransposeGradOpKernel : public framework::OpKernel<T> {
    }
    // ------------------- cudnn conv workspace ---------------------
-    // Already on GPU
+    // Get cudnn workspace
-    void* cudnn_workspace = nullptr;
+    void* cudnn_workspace = dev_ctx.cudnn_workspace(workspace_size_in_bytes);
-    platform::CUDAPlace gpu = boost::get<platform::CUDAPlace>(ctx.GetPlace());
-    cudnn_workspace = paddle::memory::Alloc(gpu, workspace_size_in_bytes);
    // ------------------- cudnn conv backward data ---------------------
    // FIXME(typhoonzero): template type T may not be the same as cudnn call.
    int input_offset = input->numel() / input->dims()[0] / groups;
@@ -245,9 +239,6 @@ class CUDNNConvTransposeGradOpKernel : public framework::OpKernel<T> {
            filter_grad_data + filter_offset * g));
      }
    }
-    // Release the cudnn workspace
-    paddle::memory::Free(gpu, cudnn_workspace);
  }
 };