Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
Paddle
提交
d1a4c53e
P
Paddle
项目概览
BaiXuePrincess
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
d1a4c53e
编写于
3月 24, 2021
作者:
L
Leo Chen
提交者:
GitHub
3月 24, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
[NPU] support default stream (#31510)
上级
fead5631
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
17 addition
and
4 deletion
+17
-4
paddle/fluid/operators/npu_op_runner.cc
paddle/fluid/operators/npu_op_runner.cc
+16
-3
paddle/fluid/operators/npu_op_runner.h
paddle/fluid/operators/npu_op_runner.h
+1
-1
未找到文件。
paddle/fluid/operators/npu_op_runner.cc
浏览文件 @
d1a4c53e
...
...
@@ -64,6 +64,13 @@ aclFormat ConvertToNpuFormat(DataLayout layout) {
return
iter
->
second
;
}
aclrtStream
GetCurrentNPUStream
()
{
int
device_id
=
GetCurrentNPUDeviceId
();
platform
::
DeviceContextPool
&
pool
=
platform
::
DeviceContextPool
::
Instance
();
auto
&
dev_ctx
=
*
pool
.
Get
(
platform
::
NPUPlace
(
device_id
));
return
dev_ctx
->
stream
();
}
NpuOpRunner
::
NpuOpRunner
(
std
::
string
op_type
)
:
op_type_
(
op_type
)
{
attr_
=
aclopCreateAttr
();
}
...
...
@@ -249,7 +256,7 @@ aclTensorDesc *NpuOpRunner::CreateTensorDesc(Tensor tensor) {
auto
format
=
ConvertToNpuFormat
(
tensor
.
layout
());
auto
dims
=
framework
::
vectorize
(
tensor
.
dims
());
VLOG
(
4
)
<<
"dtype:"
<<
dtype
<<
" "
VLOG
(
4
)
<<
"
NPU
dtype:"
<<
dtype
<<
" "
<<
"rank:"
<<
dims
.
size
()
<<
" dims:"
<<
tensor
.
dims
()
<<
" format:"
<<
format
;
...
...
@@ -264,7 +271,7 @@ aclTensorDesc *NpuOpRunner::CreateTensorDesc(Tensor tensor) {
aclDataBuffer
*
NpuOpRunner
::
CreateDataBuffer
(
Tensor
tensor
)
{
void
*
ptr
=
tensor
.
data
<
void
>
();
VLOG
(
4
)
<<
"ptr: "
<<
ptr
<<
", size: "
<<
tensor
.
memory_size
();
VLOG
(
4
)
<<
"
NPU
ptr: "
<<
ptr
<<
", size: "
<<
tensor
.
memory_size
();
auto
*
buffer
=
aclCreateDataBuffer
(
ptr
,
tensor
.
memory_size
());
PADDLE_ENFORCE_NOT_NULL
(
buffer
,
platform
::
errors
::
External
(
"Call aclCreateDataBuffer failed."
));
...
...
@@ -272,11 +279,17 @@ aclDataBuffer *NpuOpRunner::CreateDataBuffer(Tensor tensor) {
}
void
NpuOpRunner
::
Run
(
aclrtStream
stream
)
{
if
(
!
stream
)
{
VLOG
(
4
)
<<
"Run with default current npu stream: "
<<
stream
;
stream
=
GetCurrentNPUStream
();
}
VLOG
(
4
)
<<
"op_type: "
<<
op_type_
;
VLOG
(
4
)
<<
"input_desc.size: "
<<
input_descs_
.
size
();
VLOG
(
4
)
<<
"output_desc.size: "
<<
output_descs_
.
size
();
VLOG
(
4
)
<<
"stream: "
<<
stream
;
VLOG
(
4
)
<<
"attr: "
<<
attr_
;
VLOG
(
4
)
<<
"stream: "
<<
stream
;
aclError
ret
=
aclopCompileAndExecute
(
op_type_
.
c_str
(),
input_descs_
.
size
(),
input_descs_
.
data
(),
input_buffers_
.
data
(),
output_descs_
.
size
(),
output_descs_
.
data
(),
...
...
paddle/fluid/operators/npu_op_runner.h
浏览文件 @
d1a4c53e
...
...
@@ -69,7 +69,7 @@ class NpuOpRunner {
std
::
vector
<
aclDataBuffer
*>
&
GetOutputBuffers
();
void
Run
(
aclrtStream
stream
);
void
Run
(
aclrtStream
stream
==
nullptrr
);
private:
aclTensorDesc
*
CreateTensorDesc
(
Tensor
tensor
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录