Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
bd3b9cb6
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
404
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
bd3b9cb6
编写于
9月 09, 2020
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(mge/oprmm): fix grad for collective comm
GitOrigin-RevId: 8e28f46c905002857431bf725ef414afc4a48704
上级
8d02d104
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
65 addition
and
0 deletion
+65
-0
imperative/src/impl/ops/collective_comm.cpp
imperative/src/impl/ops/collective_comm.cpp
+18
-0
imperative/src/include/megbrain/imperative/ops/tensor_manip.h
...rative/src/include/megbrain/imperative/ops/tensor_manip.h
+47
-0
未找到文件。
imperative/src/impl/ops/collective_comm.cpp
浏览文件 @
bd3b9cb6
...
...
@@ -49,8 +49,26 @@ cg::OperatorNodeBase* apply_on_var_node(
dev_buffer_arr
,
config
,
disable
));
}
std
::
tuple
<
std
::
string
,
std
::
string
>
split_address
(
const
std
::
string
&
address_and_port
){
auto
index
=
address_and_port
.
find_last_of
(
':'
);
mgb_assert
(
index
!=
std
::
string
::
npos
,
"missing ':' in server address"
);
return
{
address_and_port
.
substr
(
0
,
index
),
address_and_port
.
substr
(
index
+
1
)};
}
std
::
shared_ptr
<
OpDef
>
make_from_op_node
(
cg
::
OperatorNodeBase
*
node
)
{
auto
&&
comm
=
node
->
cast_final_safe
<
opr
::
CollectiveComm
>
();
auto
&&
group_client
=
comm
.
group_client
();
auto
[
addr
,
port
]
=
split_address
(
group_client
->
get_addr
());
auto
comp_node
=
node
->
config
().
get_single_comp_node
().
to_string_logical
();
return
std
::
make_shared
<
CollectiveComm
>
(
comm
.
key
(),
comm
.
nr_devices
(),
comm
.
rank
(),
comm
.
is_root
(),
comm
.
local_grad
(),
addr
,
std
::
stoi
(
port
),
comm
.
param
().
mode
,
comm
.
dtype
(),
comm
.
backend
(),
comp_node
);
}
OP_TRAIT_REG
(
CollectiveComm
,
CollectiveComm
,
opr
::
CollectiveComm
)
.
apply_on_var_node
(
apply_on_var_node
)
.
make_from_op_node
(
make_from_op_node
)
.
fallback
();
}
// anonymous namespace
...
...
imperative/src/include/megbrain/imperative/ops/tensor_manip.h
浏览文件 @
bd3b9cb6
...
...
@@ -13,6 +13,8 @@
#include "megbrain/imperative/op_def.h"
#include "megbrain/utils/hash.h"
namespace
mgb
::
imperative
{
class
GetVarShape
:
public
OpDefImplBase
<
GetVarShape
>
{
...
...
@@ -41,6 +43,33 @@ public:
std
::
vector
<
dt_int32
>
offsets
;
std
::
vector
<
std
::
vector
<
size_t
>>
shapes
;
size_t
hash
()
const
override
{
XXHash
builder
;
for
(
auto
&&
offset
:
offsets
)
{
builder
.
update
(
&
offset
,
sizeof
(
offset
));
}
auto
&&
offset_cnt
=
offsets
.
size
();
builder
.
update
(
&
offset_cnt
,
sizeof
(
offset_cnt
));
for
(
auto
&&
shape
:
shapes
)
{
for
(
auto
&&
dim_len
:
shape
)
{
builder
.
update
(
&
dim_len
,
sizeof
(
dim_len
));
}
auto
&&
dim_cnt
=
shape
.
size
();
builder
.
update
(
&
dim_cnt
,
sizeof
(
dim_cnt
));
}
auto
&&
shape_cnt
=
shapes
.
size
();
builder
.
update
(
&
shape_cnt
,
sizeof
(
shape_cnt
));
return
builder
.
digest
();
}
bool
is_same_st
(
const
Hashable
&
rhs
)
const
override
{
auto
*
pps
=
rhs
.
try_cast_final
<
ParamPackSplit
>
();
if
(
pps
==
nullptr
){
return
false
;
}
return
offsets
==
pps
->
offsets
&&
shapes
==
pps
->
shapes
;
}
};
class
ParamPackConcat
:
public
OpDefImplBase
<
ParamPackConcat
>
{
...
...
@@ -53,6 +82,24 @@ public:
:
offsets
(
offsets_
)
{}
std
::
vector
<
dt_int32
>
offsets
;
size_t
hash
()
const
override
{
XXHash
builder
;
for
(
auto
&&
offset
:
offsets
)
{
builder
.
update
(
&
offset
,
sizeof
(
offset
));
}
auto
&&
offset_cnt
=
offsets
.
size
();
builder
.
update
(
&
offset_cnt
,
sizeof
(
offset_cnt
));
return
builder
.
digest
();
}
bool
is_same_st
(
const
Hashable
&
rhs
)
const
override
{
auto
*
ppc
=
rhs
.
try_cast_final
<
ParamPackConcat
>
();
if
(
ppc
==
nullptr
){
return
false
;
}
return
offsets
==
ppc
->
offsets
;
}
};
}
// namespace mgb::imperative
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录