Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
7cfddf22
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
7cfddf22
编写于
6月 04, 2019
作者:
B
Brian Liu
提交者:
Tao Luo
6月 04, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Optimize bilinear interpolate op with OpenMP (#17800)
Refactor the code to be OpenMP friendly test=develop
上级
d6d33fd7
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
56 addition
and
16 deletion
+56
-16
paddle/fluid/operators/interpolate_op.h
paddle/fluid/operators/interpolate_op.h
+56
-16
未找到文件。
paddle/fluid/operators/interpolate_op.h
浏览文件 @
7cfddf22
...
@@ -11,6 +11,7 @@
...
@@ -11,6 +11,7 @@
#pragma once
#pragma once
#include <string>
#include <string>
#include <vector>
#include "paddle/fluid/framework/op_registry.h"
#include "paddle/fluid/framework/op_registry.h"
#include "paddle/fluid/operators/math/math_function.h"
#include "paddle/fluid/operators/math/math_function.h"
...
@@ -57,7 +58,17 @@ static void BilinearInterpolation(const Tensor& input, Tensor* output,
...
@@ -57,7 +58,17 @@ static void BilinearInterpolation(const Tensor& input, Tensor* output,
auto
input_t
=
EigenTensor
<
T
,
4
>::
From
(
input
);
auto
input_t
=
EigenTensor
<
T
,
4
>::
From
(
input
);
auto
output_t
=
EigenTensor
<
T
,
4
>::
From
(
*
output
);
auto
output_t
=
EigenTensor
<
T
,
4
>::
From
(
*
output
);
bool
align_flag
=
(
align_mode
==
0
&&
!
align_corners
);
bool
align_flag
=
(
align_mode
==
0
&&
!
align_corners
);
for
(
int
k
=
0
;
k
<
out_h
;
k
++
)
{
// loop for images
std
::
vector
<
int
>
vy_n
,
vy_s
;
std
::
vector
<
float
>
vd_n
,
vd_s
;
vy_n
.
reserve
(
out_h
);
vy_s
.
reserve
(
out_h
);
vd_n
.
reserve
(
out_h
);
vd_s
.
reserve
(
out_h
);
#ifdef PADDLE_WITH_MKLML
#pragma omp parallel for
#endif
for
(
int
k
=
0
;
k
<
out_h
;
k
++
)
{
int
y_n
=
align_flag
?
static_cast
<
int
>
(
ratio_h
*
(
k
+
0.5
)
-
0.5
)
int
y_n
=
align_flag
?
static_cast
<
int
>
(
ratio_h
*
(
k
+
0.5
)
-
0.5
)
:
static_cast
<
int
>
(
ratio_h
*
k
);
:
static_cast
<
int
>
(
ratio_h
*
k
);
y_n
=
(
y_n
>
0
)
?
y_n
:
0
;
y_n
=
(
y_n
>
0
)
?
y_n
:
0
;
...
@@ -65,24 +76,53 @@ static void BilinearInterpolation(const Tensor& input, Tensor* output,
...
@@ -65,24 +76,53 @@ static void BilinearInterpolation(const Tensor& input, Tensor* output,
float
d_n
=
float
d_n
=
align_flag
?
ratio_h
*
(
k
+
0.5
)
-
0.5
-
y_n
:
ratio_h
*
k
-
y_n
;
align_flag
?
ratio_h
*
(
k
+
0.5
)
-
0.5
-
y_n
:
ratio_h
*
k
-
y_n
;
float
d_s
=
1.
f
-
d_n
;
float
d_s
=
1.
f
-
d_n
;
{
vy_n
[
k
]
=
y_n
;
vy_s
[
k
]
=
y_s
;
vd_n
[
k
]
=
d_n
;
vd_s
[
k
]
=
d_s
;
}
}
for
(
int
l
=
0
;
l
<
out_w
;
l
++
)
{
std
::
vector
<
int
>
vx_w
,
vx_e
;
int
x_w
=
(
align_mode
==
0
&&
!
align_corners
)
std
::
vector
<
float
>
vd_w
,
vd_e
;
?
static_cast
<
int
>
(
ratio_w
*
(
l
+
0.5
)
-
0.5
)
vx_w
.
reserve
(
out_w
);
:
static_cast
<
int
>
(
ratio_w
*
l
);
vx_e
.
reserve
(
out_w
);
x_w
=
(
x_w
>
0
)
?
x_w
:
0
;
vd_w
.
reserve
(
out_w
);
int
x_e
=
(
x_w
+
1
)
<
(
in_w
-
1
)
?
(
x_w
+
1
)
:
(
in_w
-
1
);
vd_e
.
reserve
(
out_w
);
float
d_w
=
#ifdef PADDLE_WITH_MKLML
align_flag
?
ratio_w
*
(
l
+
0.5
)
-
0.5
-
x_w
:
ratio_w
*
l
-
x_w
;
#pragma omp parallel for
float
d_e
=
1.
f
-
d_w
;
#endif
for
(
int
l
=
0
;
l
<
out_w
;
l
++
)
{
int
x_w
=
(
align_mode
==
0
&&
!
align_corners
)
?
static_cast
<
int
>
(
ratio_w
*
(
l
+
0.5
)
-
0.5
)
:
static_cast
<
int
>
(
ratio_w
*
l
);
x_w
=
(
x_w
>
0
)
?
x_w
:
0
;
int
x_e
=
(
x_w
+
1
)
<
(
in_w
-
1
)
?
(
x_w
+
1
)
:
(
in_w
-
1
);
float
d_w
=
align_flag
?
ratio_w
*
(
l
+
0.5
)
-
0.5
-
x_w
:
ratio_w
*
l
-
x_w
;
float
d_e
=
1.
f
-
d_w
;
{
vx_w
[
l
]
=
x_w
;
vx_e
[
l
]
=
x_e
;
vd_w
[
l
]
=
d_w
;
vd_e
[
l
]
=
d_e
;
}
}
for
(
int
i
=
0
;
i
<
n
;
i
++
)
{
// loop for batches
#ifdef PADDLE_WITH_MKLML
for
(
int
j
=
0
;
j
<
c
;
j
++
)
{
// loop for channels
#pragma omp parallel for collapse(4)
#endif
for
(
int
i
=
0
;
i
<
n
;
i
++
)
{
// loop for batches
for
(
int
j
=
0
;
j
<
c
;
j
++
)
{
// loop for channels
for
(
int
k
=
0
;
k
<
out_h
;
k
++
)
{
// loop for images
for
(
int
l
=
0
;
l
<
out_w
;
l
++
)
{
// bilinear interpolation
// bilinear interpolation
output_t
(
i
,
j
,
k
,
l
)
=
input_t
(
i
,
j
,
y_n
,
x_w
)
*
d_s
*
d_e
+
T
out_t
=
input_t
(
i
,
j
,
vy_n
[
k
],
vx_w
[
l
])
*
vd_s
[
k
]
*
vd_e
[
l
]
+
input_t
(
i
,
j
,
y_s
,
x_w
)
*
d_n
*
d_e
+
input_t
(
i
,
j
,
vy_s
[
k
],
vx_w
[
l
])
*
vd_n
[
k
]
*
vd_e
[
l
]
+
input_t
(
i
,
j
,
y_n
,
x_e
)
*
d_s
*
d_w
+
input_t
(
i
,
j
,
vy_n
[
k
],
vx_e
[
l
])
*
vd_s
[
k
]
*
vd_w
[
l
]
+
input_t
(
i
,
j
,
y_s
,
x_e
)
*
d_n
*
d_w
;
input_t
(
i
,
j
,
vy_s
[
k
],
vx_e
[
l
])
*
vd_n
[
k
]
*
vd_w
[
l
];
output_t
(
i
,
j
,
k
,
l
)
=
out_t
;
}
}
}
}
}
}
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录