Merge pull request #1117 from codeWorm2015/opencl

update cl tensor

Merge pull request #1117 from codeWorm2015/opencl
update cl tensor
9f739584 · Ray Liu · GitHub · daa60546 · bb07379e · 9f739584
隐藏空白更改
内联并排

Showing with 9 addition and 7 deletion

src/framework/cl/cl_tensor.h src/framework/cl/cl_tensor.h +8 -6

src/operators/kernel/cl/feed_kernel.cpp src/operators/kernel/cl/feed_kernel.cpp +1 -1

未找到文件。
--- a/src/framework/cl/cl_tensor.h
+++ b/src/framework/cl/cl_tensor.h
@@ -48,12 +48,14 @@ class CLTensor : TensorBase {
    return *this;
  }
-  inline cl_mem mutable_with_data(void *data) {
+  template <typename T>
-    int64_t size = numel() * sizeof(float);
+  inline cl_mem mutable_with_data(const T *data) {
-    holder_.reset(new PlaceholderImpl(size, data, typeid(cl_mem), context_,
+    int64_t size = numel() * sizeof(T);
-                                      command_queue_));
-    return reinterpret_cast<cl_mem>(
+    holder_.reset(new PlaceholderImpl(
-        reinterpret_cast<void *>(reinterpret_cast<uintptr_t>(holder_->ptr())));
+        size, reinterpret_cast<void *>(const_cast<T *>(data)), typeid(T),
+        context_, command_queue_));
+    return reinterpret_cast<cl_mem>(holder_->ptr());
  }
  inline cl_mem mutable_data(std::type_index type) {

--- a/src/operators/kernel/cl/feed_kernel.cpp
+++ b/src/operators/kernel/cl/feed_kernel.cpp
@@ -39,7 +39,7 @@ void FeedKernel<GPU_CL, float>::Compute(const FeedParam<GPU_CL> &param) {
  CLTensor input_cl_tensor(this->cl_helper_.CLContext(),
                           this->cl_helper_.CLCommandQueue());
  input_cl_tensor.Resize(input->dims());
-  cl_mem inputBuffer = input_cl_tensor.mutable_with_data((void *)input_data);
+  cl_mem inputBuffer = input_cl_tensor.mutable_with_data<float>(input_data);
  status = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&inputBuffer);
  CL_CHECK_ERRORS(status);