Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Crayon鑫
Paddle
提交
1b71a718
P
Paddle
项目概览
Crayon鑫
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
1b71a718
编写于
8月 18, 2021
作者:
J
Jackwaterveg
提交者:
GitHub
8月 18, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
[NPU] Add square grad (#34889)
* test=develop * test=develop
上级
40f62737
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
39 addition
and
6 deletion
+39
-6
paddle/fluid/operators/activation_op_npu.cc
paddle/fluid/operators/activation_op_npu.cc
+35
-0
python/paddle/fluid/tests/unittests/npu/test_square_op_npu.py
...on/paddle/fluid/tests/unittests/npu/test_square_op_npu.py
+4
-6
未找到文件。
paddle/fluid/operators/activation_op_npu.cc
100755 → 100644
浏览文件 @
1b71a718
...
...
@@ -386,6 +386,35 @@ class SquareNPUKernel : public framework::OpKernel<T> {
}
};
template
<
typename
DeviceContext
,
typename
T
>
class
SquareGradNPUKernel
:
public
framework
::
OpKernel
<
T
>
{
public:
void
Compute
(
const
framework
::
ExecutionContext
&
ctx
)
const
override
{
auto
*
x
=
ctx
.
Input
<
Tensor
>
(
"X"
);
auto
*
dout
=
ctx
.
Input
<
Tensor
>
(
framework
::
GradVarName
(
"Out"
));
auto
*
dx
=
ctx
.
Output
<
Tensor
>
(
framework
::
GradVarName
(
"X"
));
auto
factor
=
static_cast
<
float
>
(
2.0
);
auto
place
=
ctx
.
GetPlace
();
auto
stream
=
ctx
.
template
device_context
<
paddle
::
platform
::
NPUDeviceContext
>()
.
stream
();
// Step 1: Compute x_muls_factor = factor * x
Tensor
x_muls_factor
(
x
->
type
());
x_muls_factor
.
mutable_data
<
T
>
(
x
->
dims
(),
place
);
const
auto
&
runner_muls_1
=
NpuOpRunner
(
"Muls"
,
{
*
x
},
{
x_muls_factor
},
{{
"value"
,
factor
}});
runner_muls_1
.
Run
(
stream
);
// Step 2: Compute dx = dout * factor * x
dx
->
mutable_data
<
T
>
(
place
);
const
auto
&
runner_mul_2
=
NpuOpRunner
(
"Mul"
,
{
*
dout
,
x_muls_factor
},
{
*
dx
},
{});
runner_mul_2
.
Run
(
stream
);
}
};
template
<
typename
DeviceContext
,
typename
T
>
class
SigmoidNPUKernel
:
public
framework
::
OpKernel
<
T
>
{
public:
...
...
@@ -869,6 +898,12 @@ REGISTER_OP_NPU_KERNEL(
paddle
::
platform
::
float16
>
,
ops
::
SquareNPUKernel
<
paddle
::
platform
::
NPUDeviceContext
,
int
>
);
REGISTER_OP_NPU_KERNEL
(
square_grad
,
ops
::
SquareGradNPUKernel
<
paddle
::
platform
::
NPUDeviceContext
,
float
>
,
ops
::
SquareNPUKernel
<
paddle
::
platform
::
NPUDeviceContext
,
paddle
::
platform
::
float16
>
);
REGISTER_OP_NPU_KERNEL
(
sigmoid
,
ops
::
SigmoidNPUKernel
<
paddle
::
platform
::
NPUDeviceContext
,
float
>
,
ops
::
SigmoidNPUKernel
<
paddle
::
platform
::
NPUDeviceContext
,
...
...
python/paddle/fluid/tests/unittests/npu/test_square_op_npu.py
浏览文件 @
1b71a718
...
...
@@ -50,12 +50,10 @@ class TestSquare(OpTest):
def
test_check_output
(
self
):
self
.
check_output_with_place
(
self
.
place
)
# TODO(ascendrc): Add grad test
# def test_check_grad(self):
# if self.dtype == np.float16:
# return
# self.check_grad(['X'], 'Out')
#
def
test_check_grad
(
self
):
if
self
.
dtype
==
np
.
float16
:
return
self
.
check_grad_with_place
(
self
.
place
,
[
'X'
],
'Out'
)
class
TestSquareFp16
(
OpTest
):
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录