Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Crayon鑫
Paddle
提交
d8d2dbcf
P
Paddle
项目概览
Crayon鑫
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
d8d2dbcf
编写于
7月 30, 2018
作者:
T
tensor-tang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
further optimize im2col using variables
上级
5373fe29
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
21 addition
and
14 deletion
+21
-14
paddle/fluid/operators/math/im2col_cfo_cpu.h
paddle/fluid/operators/math/im2col_cfo_cpu.h
+21
-14
未找到文件。
paddle/fluid/operators/math/im2col_cfo_cpu.h
浏览文件 @
d8d2dbcf
...
@@ -80,11 +80,13 @@ inline void im2col_sh1sw1dh1dw1ph0pw0(const framework::Tensor& im,
...
@@ -80,11 +80,13 @@ inline void im2col_sh1sw1dh1dw1ph0pw0(const framework::Tensor& im,
int
col_matrix_width
=
output_width
*
output_height
;
int
col_matrix_width
=
output_width
*
output_height
;
int
im_size
=
im_height
*
im_width
;
int
im_size
=
im_height
*
im_width
;
size_t
copy_size
=
sizeof
(
T
)
*
output_width
;
size_t
copy_size
=
sizeof
(
T
)
*
output_width
;
const
T
*
im_data_oh
=
im_data
;
T
*
dst_data_oh
=
col_data
;
for
(
int
oh
=
0
;
oh
<
output_height
;
++
oh
)
{
for
(
int
oh
=
0
;
oh
<
output_height
;
++
oh
)
{
const
T
*
im_data_start
=
im_data
+
oh
*
im_widt
h
;
const
T
*
src_data_ic
=
im_data_o
h
;
T
*
dst_data
=
col_data
+
oh
*
output_widt
h
;
T
*
dst_data
=
dst_data_o
h
;
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
const
T
*
src_data
=
im_data_start
+
ic
*
im_size
;
const
T
*
src_data
=
src_data_ic
;
for
(
int
kh
=
0
;
kh
<
filter_height
;
++
kh
)
{
for
(
int
kh
=
0
;
kh
<
filter_height
;
++
kh
)
{
for
(
int
kw
=
0
;
kw
<
filter_width
;
++
kw
)
{
for
(
int
kw
=
0
;
kw
<
filter_width
;
++
kw
)
{
std
::
memcpy
(
dst_data
,
src_data
+
kw
,
copy_size
);
std
::
memcpy
(
dst_data
,
src_data
+
kw
,
copy_size
);
...
@@ -92,7 +94,10 @@ inline void im2col_sh1sw1dh1dw1ph0pw0(const framework::Tensor& im,
...
@@ -92,7 +94,10 @@ inline void im2col_sh1sw1dh1dw1ph0pw0(const framework::Tensor& im,
}
}
src_data
=
src_data
+
im_width
;
src_data
=
src_data
+
im_width
;
}
}
src_data_ic
=
src_data_ic
+
im_size
;
}
}
im_data_oh
=
im_data_oh
+
im_width
;
dst_data_oh
=
dst_data_oh
+
output_width
;
}
}
}
}
...
@@ -130,34 +135,36 @@ inline void im2col_sh1sw1dh1dw1ph1pw1(const framework::Tensor& im,
...
@@ -130,34 +135,36 @@ inline void im2col_sh1sw1dh1dw1ph1pw1(const framework::Tensor& im,
T
*
col_start_r
=
col_data
+
(
filter_height
-
1
)
*
col_block_fh
+
T
*
col_start_r
=
col_data
+
(
filter_height
-
1
)
*
col_block_fh
+
col_matrix_width
-
output_width
;
col_matrix_width
-
output_width
;
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
// TODO(TJ): move * outside
T
*
dst_data_l
=
col_start_l
;
T
*
dst_data_l
=
col_start_l
+
ic
*
col_block_ic
;
T
*
dst_data_r
=
col_start_r
;
T
*
dst_data_r
=
col_start_r
+
ic
*
col_block_ic
;
for
(
int
kw
=
0
;
kw
<
filter_width
;
++
kw
)
{
for
(
int
kw
=
0
;
kw
<
filter_width
;
++
kw
)
{
std
::
memset
(
dst_data_l
,
0
,
copy_size
);
std
::
memset
(
dst_data_l
,
0
,
copy_size
);
std
::
memset
(
dst_data_r
,
0
,
copy_size
);
std
::
memset
(
dst_data_r
,
0
,
copy_size
);
dst_data_l
=
dst_data_l
+
col_matrix_width
;
dst_data_l
=
dst_data_l
+
col_matrix_width
;
dst_data_r
=
dst_data_r
+
col_matrix_width
;
dst_data_r
=
dst_data_r
+
col_matrix_width
;
}
}
col_start_l
=
col_start_l
+
col_block_ic
;
col_start_r
=
col_start_r
+
col_block_ic
;
}
}
}
}
auto
pad
=
static_cast
<
T
>
(
0
);
auto
pad
=
static_cast
<
T
>
(
0
);
if
(
filter_width
==
1
)
{
if
(
filter_width
==
1
)
{
// fill width padding
// fill width padding
T
*
dst_data_ic
=
col_data
;
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
// TODO(TJ): move * outside
T
*
dst_data_kh
=
dst_data_ic
;
T
*
dst_data_ic
=
col_data
+
ic
*
col_block_ic
;
for
(
int
kh
=
0
;
kh
<
filter_height
;
++
kh
)
{
for
(
int
kh
=
0
;
kh
<
filter_height
;
++
kh
)
{
// TODO(TJ): move * outside
T
*
dst_data
=
dst_data_kh
;
T
*
dst_data
=
dst_data_ic
+
kh
*
col_block_fh
;
for
(
int
oh
=
0
;
oh
<
output_height
;
++
oh
)
{
for
(
int
oh
=
0
;
oh
<
output_height
;
++
oh
)
{
*
dst_data
=
pad
;
*
dst_data
=
pad
;
dst_data
=
dst_data
+
output_width
-
1
;
dst_data
=
dst_data
+
output_width
-
1
;
*
dst_data
=
pad
;
*
dst_data
=
pad
;
++
dst_data
;
++
dst_data
;
}
}
dst_data_kh
=
dst_data_kh
+
col_block_fh
;
}
}
dst_data_ic
=
dst_data_ic
+
col_block_ic
;
}
}
// fill core
// fill core
size_t
copy_size
=
sizeof
(
T
)
*
(
output_width
-
plw
-
prw
);
size_t
copy_size
=
sizeof
(
T
)
*
(
output_width
-
plw
-
prw
);
...
@@ -184,12 +191,10 @@ inline void im2col_sh1sw1dh1dw1ph1pw1(const framework::Tensor& im,
...
@@ -184,12 +191,10 @@ inline void im2col_sh1sw1dh1dw1ph1pw1(const framework::Tensor& im,
// filter_width != 1
// filter_width != 1
// fill width padding
// fill width padding
T
*
dst_data_ic
=
col_data
;
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
for
(
int
ic
=
0
;
ic
<
im_channels
;
++
ic
)
{
// TODO(TJ): move * outside
T
*
dst_data_kh
=
dst_data_ic
;
T
*
dst_data_ic
=
col_data
+
ic
*
col_block_ic
;
for
(
int
kh
=
0
;
kh
<
filter_height
;
++
kh
)
{
for
(
int
kh
=
0
;
kh
<
filter_height
;
++
kh
)
{
// TODO(TJ): move * outside
T
*
dst_data_kh
=
dst_data_ic
+
kh
*
col_block_fh
;
for
(
T
*
dst_data
:
for
(
T
*
dst_data
:
{
dst_data_kh
,
dst_data_kh
+
(
filter_width
-
prw
)
*
col_matrix_width
+
{
dst_data_kh
,
dst_data_kh
+
(
filter_width
-
prw
)
*
col_matrix_width
+
output_width
-
1
})
{
output_width
-
1
})
{
...
@@ -199,7 +204,9 @@ inline void im2col_sh1sw1dh1dw1ph1pw1(const framework::Tensor& im,
...
@@ -199,7 +204,9 @@ inline void im2col_sh1sw1dh1dw1ph1pw1(const framework::Tensor& im,
dst_data
=
dst_data
+
output_width
;
dst_data
=
dst_data
+
output_width
;
}
}
}
}
dst_data_kh
=
dst_data_kh
+
col_block_fh
;
}
}
dst_data_ic
=
dst_data_ic
+
col_block_ic
;
}
}
// TODO(TJ): use array like: size_t copy_size[kw]={sizeof(T) *
// TODO(TJ): use array like: size_t copy_size[kw]={sizeof(T) *
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录