Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Xiaomi
Mace
提交
487231a8
Mace
项目概览
Xiaomi
/
Mace
通知
106
Star
40
Fork
27
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
Mace
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
487231a8
编写于
3月 29, 2018
作者:
U
Unknown
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix depth to space opencl bugs
上级
7e1bb423
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
4 addition
and
23 deletion
+4
-23
mace/kernels/eltwise.h
mace/kernels/eltwise.h
+1
-1
mace/kernels/opencl/cl/depth_to_space.cl
mace/kernels/opencl/cl/depth_to_space.cl
+1
-20
mace/kernels/opencl/depth_to_space_opencl.cc
mace/kernels/opencl/depth_to_space_opencl.cc
+2
-2
未找到文件。
mace/kernels/eltwise.h
浏览文件 @
487231a8
...
...
@@ -65,7 +65,7 @@ struct EltwiseFunctor : EltwiseFunctorBase {
#pragma omp parallel for
for
(
index_t
i
=
0
;
i
<
size
;
++
i
)
{
output_ptr
[
i
]
=
coeff_
[
0
]
*
input0_ptr
[
i
]
+
coeff_
[
1
]
*
input1_ptr
[
i
];
coeff_
[
0
]
*
input0_ptr
[
i
]
+
coeff_
[
1
]
*
input1_ptr
[
i
];
}
}
break
;
...
...
mace/kernels/opencl/cl/depth_to_space.cl
浏览文件 @
487231a8
...
...
@@ -15,16 +15,6 @@ __kernel void depth_to_space(
const
int
out_w
=
get_global_id
(
1
)
;
const
int
out_h
=
get_global_id
(
2
)
;
#
ifndef
NON_UNIFORM_WORK_GROUP
if
(
out_d
>=
global_size_dim0
|
| out_w >= global_size_dim1
|| out_h >= global_size_dim2) {
return;
}
const int output_width = global_size_dim1;
#else
const int output_width = get_global_size(1);
#endif
if
(
out_d
>=
output_depth_blocks
|
| out_h >= output_height || out_w >= output_width)
return;
...
...
@@ -61,15 +51,8 @@ __kernel void space_to_depth(
const int w = get_global_id(1);
const int h = get_global_id(2);
#ifndef NON_UNIFORM_WORK_GROUP
if (d >= global_size_dim0 || w >= global_size_dim1
|| h >= global_size_dim2) {
if (h >= input_height || w >= input_width || d >= input_depth_blocks)
return;
}
const int input_width = global_size_dim1;
#else
const int input_width = get_global_size(1);
#endif
const int in_pos = mad24(d, input_width, w);
...
...
@@ -84,8 +67,6 @@ __kernel void space_to_depth(
return
;
const
int
out_pos
=
mad24
(
out_d,
output_width,
out_w
)
;
DATA_TYPE4
in_data
=
READ_IMAGET
(
input,
SAMPLER,
(
int2
)(
in_pos,
h
))
;
WRITE_IMAGET
(
output,
(
int2
)(
out_pos,
out_h
)
,
in_data
)
;
}
mace/kernels/opencl/depth_to_space_opencl.cc
浏览文件 @
487231a8
...
...
@@ -70,13 +70,13 @@ void DepthToSpaceOpFunctor<DeviceType::OPENCL, T>::operator()(
std
::
stringstream
ss
;
if
(
!
IsVecEqual
(
input_shape_
,
input
->
shape
()))
{
if
(
d2s_
)
{
gws
[
0
]
=
static_cast
<
uint32_t
>
(
depth_blocks
);
gws
[
0
]
=
static_cast
<
uint32_t
>
(
output_
depth_blocks
);
gws
[
1
]
=
static_cast
<
uint32_t
>
(
output_width
);
gws
[
2
]
=
static_cast
<
uint32_t
>
(
output_height
*
batch
);
ss
<<
"depth_to_space_opencl_kernel_"
<<
output
->
dim
(
0
)
<<
"_"
<<
output
->
dim
(
1
)
<<
"_"
<<
output
->
dim
(
2
)
<<
"_"
<<
output
->
dim
(
3
);
}
else
{
gws
[
0
]
=
static_cast
<
uint32_t
>
(
depth_blocks
);
gws
[
0
]
=
static_cast
<
uint32_t
>
(
input_
depth_blocks
);
gws
[
1
]
=
static_cast
<
uint32_t
>
(
input_width
);
gws
[
2
]
=
static_cast
<
uint32_t
>
(
input_height
*
batch
);
ss
<<
"space_to_depth_opencl_kernel_"
<<
input
->
dim
(
0
)
<<
"_"
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录