Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
7f03ae9a
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
403
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
7f03ae9a
编写于
1月 14, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(imperative): reduce tls usage
GitOrigin-RevId: a716b2ae9806e498b8f9d22a981235a8cb9d69e5
上级
85ea882c
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
26 addition
and
14 deletion
+26
-14
imperative/src/impl/op_def.cpp
imperative/src/impl/op_def.cpp
+12
-12
imperative/src/impl/ops/utility.cpp
imperative/src/impl/ops/utility.cpp
+14
-2
未找到文件。
imperative/src/impl/op_def.cpp
浏览文件 @
7f03ae9a
...
...
@@ -77,16 +77,16 @@ EncodedSubgraph OpDef::make_backward_graph(
const
SmallVector
<
bool
>&
output_has_grad
)
{
using
BackwardGraphCache
=
OpMethResultCache
<
EncodedSubgraph
,
SmallVector
<
bool
>
,
SmallVector
<
bool
>>
;
thread_local
BackwardGraphCache
cache
;
decltype
(
cache
)
::
key_t
cache_key
{
thread_local
auto
cache
=
std
::
make_unique
<
BackwardGraphCache
>
()
;
BackwardGraphCache
::
key_t
cache_key
{
const_cast
<
OpDef
&>
(
def
).
shared_from_this
(),
inputs
,
{
input_requires_grad
,
output_has_grad
}};
auto
iter
=
cache
.
find
(
cache_key
);
if
(
iter
==
cache
.
end
())
{
iter
=
cache
.
insert
({
cache_key
,
def
.
trait
()
->
make_backward_graph
(
def
,
inputs
,
input_requires_grad
,
output_has_grad
)})
auto
iter
=
cache
->
find
(
cache_key
);
if
(
iter
==
cache
->
end
())
{
iter
=
cache
->
insert
({
cache_key
,
def
.
trait
()
->
make_backward_graph
(
def
,
inputs
,
input_requires_grad
,
output_has_grad
)})
.
first
;
}
return
iter
->
second
;
...
...
@@ -100,12 +100,12 @@ EncodedSubgraph OpDef::make_forward_graph(
const
OpDef
&
def
,
const
SmallVector
<
LogicalTensorDesc
>&
inputs
)
{
using
ForwardGraphCache
=
OpMethResultCache
<
EncodedSubgraph
,
SmallVector
<
bool
>
,
SmallVector
<
bool
>>
;
thread_local
ForwardGraphCache
cache
;
decltype
(
cache
)
::
key_t
cache_key
{
thread_local
auto
cache
=
std
::
make_unique
<
ForwardGraphCache
>
()
;
ForwardGraphCache
::
key_t
cache_key
{
const_cast
<
OpDef
&>
(
def
).
shared_from_this
(),
inputs
};
auto
iter
=
cache
.
find
(
cache_key
);
if
(
iter
==
cache
.
end
())
{
iter
=
cache
.
insert
({
cache_key
,
def
.
trait
()
->
make_forward_graph
(
def
,
inputs
)})
auto
iter
=
cache
->
find
(
cache_key
);
if
(
iter
==
cache
->
end
())
{
iter
=
cache
->
insert
({
cache_key
,
def
.
trait
()
->
make_forward_graph
(
def
,
inputs
)})
.
first
;
}
return
iter
->
second
;
...
...
imperative/src/impl/ops/utility.cpp
浏览文件 @
7f03ae9a
...
...
@@ -34,8 +34,20 @@ auto apply_on_var_node(const OpDef& def, const VarNodeArray& inputs) {
return
inputs
;
}
auto
make_backward_graph
(
const
OpDef
&
def
,
const
SmallVector
<
LogicalTensorDesc
>&
inputs
,
const
SmallVector
<
bool
>&
input_requires_grad
,
const
SmallVector
<
bool
>&
output_has_grad
)
{
Subgraph
graph
;
graph
.
inputs
=
{
1
,
2
,
3
};
graph
.
outputs
=
{
3
};
graph
.
exprs
=
{};
return
EncodedSubgraph
::
make
(
graph
);
}
OP_TRAIT_REG
(
FastpathCopy
,
FastpathCopy
)
.
apply_on_var_node
(
apply_on_var_node
)
.
make_backward_graph
(
make_backward_graph
)
.
fallback
();
}
// namespace fastpathcopy
}
// namespace
...
...
@@ -290,10 +302,10 @@ ComputingGraphHolder& get_computing_graph(
std
::
shared_ptr
<
OpDef
>
compiled_op
,
SmallVector
<
LogicalTensorDesc
>
descs
)
{
using
ComputingGraphHolderCache
=
OpMethResultCache
<
std
::
queue
<
std
::
unique_ptr
<
ComputingGraphHolder
>>>
;
thread_local
ComputingGraphHolderCache
cache
;
thread_local
auto
cache
=
std
::
make_unique
<
ComputingGraphHolderCache
>
()
;
thread_local
size_t
nr_cg_holders
=
0
;
ComputingGraphHolderCache
::
key_t
cache_key
=
{
compiled_op
,
descs
};
auto
&
cg_holder_queue
=
cache
[
cache_key
];
auto
&
cg_holder_queue
=
(
*
cache
)
[
cache_key
];
std
::
unique_ptr
<
ComputingGraphHolder
>
holder
;
if
(
!
cg_holder_queue
.
empty
())
{
// pick one
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录