Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Xiaomi
Mace
提交
77841359
Mace
项目概览
Xiaomi
/
Mace
通知
106
Star
40
Fork
27
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
Mace
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
77841359
编写于
12月 25, 2017
作者:
L
liuqi
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Use mul24 to replace mul operator.
上级
364b9e5c
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
11 addition
and
11 deletion
+11
-11
mace/kernels/opencl/cl/space_to_batch.cl
mace/kernels/opencl/cl/space_to_batch.cl
+11
-11
未找到文件。
mace/kernels/opencl/cl/space_to_batch.cl
浏览文件 @
77841359
...
...
@@ -17,25 +17,25 @@ __kernel void space_to_batch(__read_only image2d_t space_data,
const
int
batch_b_idx
=
batch_hb_idx
/
batch_height
;
const
int
batch_h_idx
=
batch_hb_idx
%
batch_height
;
const
int
block_size
=
block_height
*
block_width
;
const
int
block_size
=
mul24
(
block_height,
block_width
)
;
const
int
space_b_idx
=
batch_b_idx
/
block_size
;
const
int
remaining_batch_idx
=
batch_b_idx
%
block_size
;
const
int
space_h_idx
=
(
remaining_batch_idx
/
block_width
)
+
batch_h_idx
*
block_height
-
padding_height
;
mul24
(
batch_h_idx,
block_height
)
-
padding_height
;
const
int
space_w_idx
=
(
remaining_batch_idx
%
block_width
)
+
batch_w_idx
*
block_width
-
padding_width
;
mul24
(
batch_w_idx,
block_width
)
-
padding_width
;
const
int
space_coord_x
=
select
(
chan_idx
*
space_width
+
space_w_idx,
const
int
space_coord_x
=
select
(
mul24
(
chan_idx,
space_width
)
+
space_w_idx,
-1
,
space_w_idx
<
0
|
| space_w_idx >= space_width);
const int space_coord_y = select(
space_b_idx * space_height
+ space_h_idx,
const int space_coord_y = select(
mul24(space_b_idx, space_height)
+ space_h_idx,
-1,
space_h_idx < 0 |
|
space_h_idx
>=
space_height
)
;
int2
space_coord
=
(
int2
)(
space_coord_x,
space_coord_y
)
;
DATA_TYPE4
value
=
READ_IMAGET
(
space_data,
SAMPLER,
space_coord
)
;
int2
batch_coord
=
(
int2
)(
chan_idx
*
batch_width
+
batch_w_idx,
batch_hb_idx
)
;
int2
batch_coord
=
(
int2
)(
mul24
(
chan_idx,
batch_width
)
+
batch_w_idx,
batch_hb_idx
)
;
WRITE_IMAGET
(
batch_data,
batch_coord,
value
)
;
}
...
...
@@ -56,20 +56,20 @@ __kernel void batch_to_space(__read_only image2d_t batch_data,
const
int
batch_b_idx
=
batch_hb_idx
/
batch_height
;
const
int
batch_h_idx
=
batch_hb_idx
%
batch_height
;
const
int
block_size
=
block_height
*
block_width
;
const
int
block_size
=
mul24
(
block_height,
block_width
)
;
const
int
space_b_idx
=
batch_b_idx
/
block_size
;
const
int
remaining_batch_idx
=
batch_b_idx
%
block_size
;
const
int
space_h_idx
=
(
remaining_batch_idx
/
block_width
)
+
batch_h_idx
*
block_height
-
padding_height
;
mul24
(
batch_h_idx,
block_height
)
-
padding_height
;
const
int
space_w_idx
=
(
remaining_batch_idx
%
block_width
)
+
batch_w_idx
*
block_width
-
padding_width
;
mul24
(
batch_w_idx,
block_width
)
-
padding_width
;
if
(
0
<=
space_w_idx
&&
space_w_idx
<
space_width
&&
0
<=
space_h_idx
&&
space_h_idx
<
space_height
)
{
int2
batch_coord
=
(
int2
)(
chan_idx
*
batch_width
+
batch_w_idx,
batch_hb_idx
)
;
int2
batch_coord
=
(
int2
)(
mul24
(
chan_idx,
batch_width
)
+
batch_w_idx,
batch_hb_idx
)
;
DATA_TYPE4
value
=
READ_IMAGET
(
batch_data,
SAMPLER,
batch_coord
)
;
int2
space_coord
=
(
int2
)(
chan_idx
*
space_width
+
space_w_idx,
int2
space_coord
=
(
int2
)(
mul24
(
chan_idx,
space_width
)
+
space_w_idx,
space_b_idx
*
space_height
+
space_h_idx
)
;
WRITE_IMAGET
(
space_data,
space_coord,
value
)
;
}
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录