Merge branch 'fix-matmul-bug' into 'master'

Fix matmul default lws bug. See merge request !705

Merge branch 'fix-matmul-bug' into 'master'
Fix matmul default lws bug. See merge request !705
ff3cc830 · 李寅 · ba1d4ed3 · 3e42149a · ff3cc830
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

mace/kernels/opencl/matmul.cc mace/kernels/opencl/matmul.cc +1 -1

未找到文件。
--- a/mace/kernels/opencl/matmul.cc
+++ b/mace/kernels/opencl/matmul.cc
@@ -82,7 +82,7 @@ MaceStatus MatMulFunctor<DeviceType::GPU, T>::operator()(const Tensor *A,
  kernel_.setArg(idx++, static_cast<int>(height_blocks));
  kernel_.setArg(idx++, static_cast<int>(RoundUpDiv4(K)));

-  const std::vector<uint32_t> lws = {kwg_size_ / 64, 64, 1};
+  const std::vector<uint32_t> lws = {kwg_size_ / 64, 64, 0};
  std::string tuning_key = Concat("matmul_opencl_kernel", batch, height, width);
  MACE_RETURN_IF_ERROR(TuningOrRun2DKernel(kernel_, tuning_key,
                                           gws, lws, future));