Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
e1c7b22f
MegEngine
项目概览
MegEngine 天元
/
MegEngine
大约 1 年 前同步成功
通知
399
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
e1c7b22f
编写于
8月 11, 2021
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
perf(ops): enable memory forward for reduce in special cases
GitOrigin-RevId: dd6e1664c50aabadc40bab6d01fb7fb31720bd8b
上级
cd60d268
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
40 addition
and
0 deletion
+40
-0
imperative/src/impl/ops/reduce.cpp
imperative/src/impl/ops/reduce.cpp
+40
-0
未找到文件。
imperative/src/impl/ops/reduce.cpp
浏览文件 @
e1c7b22f
...
@@ -11,6 +11,7 @@
...
@@ -11,6 +11,7 @@
#include "megbrain/imperative/ops/autogen.h"
#include "megbrain/imperative/ops/autogen.h"
#include "megbrain/opr/basic_arith.h"
#include "megbrain/opr/basic_arith.h"
#include "megbrain/imperative/proxy_graph_detail.h"
#include "../op_trait.h"
#include "../op_trait.h"
#include "../dnn_op_helper.h"
#include "../dnn_op_helper.h"
...
@@ -35,9 +36,48 @@ std::shared_ptr<OpDef> make_from_op_node(cg::OperatorNodeBase* node_) {
...
@@ -35,9 +36,48 @@ std::shared_ptr<OpDef> make_from_op_node(cg::OperatorNodeBase* node_) {
return
Reduce
::
make
(
node
->
param
());
return
Reduce
::
make
(
node
->
param
());
}
}
bool
memory_forward_success
(
const
OpDef
&
def
,
SmallVector
<
TensorPtr
>
inputs
)
{
auto
&&
reduce
=
static_cast
<
const
Reduce
&>
(
def
);
if
(
reduce
.
mode
!=
Reduce
::
Mode
::
SUM_SQR
&&
inputs
.
size
()
==
2
)
{
auto
shape_tensor
=
inputs
[
1
]
->
get_value
();
TensorShape
shape
;
cg
::
copy_tensor_value_to_shape
(
shape
,
shape_tensor
.
proxy_to_default_cpu
());
if
(
shape
.
eq_shape
(
inputs
[
0
]
->
shape
()))
{
return
true
;
}
}
return
false
;
}
std
::
tuple
<
SmallVector
<
MemoryDesc
>
,
SmallVector
<
MemoryDesc
>>
infer_output_mem_desc
(
const
OpDef
&
def
,
const
SmallVector
<
TensorPtr
>&
inputs_tensors
,
const
SmallVector
<
MemoryDesc
>&
inputs_mems
)
{
if
(
memory_forward_success
(
def
,
inputs_tensors
))
{
auto
&
src_desc
=
inputs_mems
[
0
];
return
{{{
src_desc
.
layout
,
0
,
src_desc
.
cn
,
StorageIdentifier
::
make
(
&
src_desc
)}},
{}};
}
return
proxy_graph_detail
::
infer_output_mem_desc
(
def
,
inputs_tensors
,
inputs_mems
);
}
void
execute
(
const
OpDef
&
def
,
SmallVector
<
TensorPtr
>
inputs
,
SmallVector
<
TensorPtr
>
outputs
,
SmallVector
<
TensorPtr
>
workspace
)
{
if
(
memory_forward_success
(
def
,
inputs
))
{
return
;
}
return
proxy_graph_detail
::
execute
(
def
,
inputs
,
outputs
,
workspace
);
}
OP_TRAIT_REG
(
Reduce
,
Reduce
,
opr
::
Reduce
)
OP_TRAIT_REG
(
Reduce
,
Reduce
,
opr
::
Reduce
)
.
make_from_op_node
(
make_from_op_node
)
.
make_from_op_node
(
make_from_op_node
)
.
apply_on_var_node
(
apply_on_var_node
)
.
apply_on_var_node
(
apply_on_var_node
)
.
infer_output_mem_desc
(
infer_output_mem_desc
)
.
execute
(
execute
)
.
fallback
();
.
fallback
();
}
// namespace reduce
}
// namespace reduce
}
// namespace
}
// namespace
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录