Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
2b3a88d0
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
403
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
2b3a88d0
编写于
6月 23, 2020
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
feat(mge/distributed): add parameter replica_mode
GitOrigin-RevId: 244e4ca437e3427d65d395f4be01b4fe6ed92e91
上级
44c381b6
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
12 addition
and
5 deletion
+12
-5
python_module/megengine/core/tensor_nn.py
python_module/megengine/core/tensor_nn.py
+3
-0
python_module/megengine/optimizer/optimizer.py
python_module/megengine/optimizer/optimizer.py
+9
-5
未找到文件。
python_module/megengine/core/tensor_nn.py
浏览文件 @
2b3a88d0
...
...
@@ -31,6 +31,9 @@ class Parameter(Tensor):
t
=
tensor
(
value
,
dtype
=
dtype
,
device
=
device
,
requires_grad
=
requires_grad
)
self
.
__dict__
.
update
(
t
.
__dict__
)
# broadcast and allreduce will not be performed in optimizer if replica_mode is False
self
.
replica_mode
=
True
@
property
def
shape
(
self
):
r
"""Return shape of parameter.
...
...
python_module/megengine/optimizer/optimizer.py
浏览文件 @
2b3a88d0
...
...
@@ -178,7 +178,7 @@ class Optimizer(metaclass=ABCMeta):
assert
len
(
grads
)
==
len
(
params
)
for
param
,
grad
in
zip
(
params
,
grads
):
if
is_distributed
():
if
is_distributed
()
and
param
.
replica_mode
:
with
opr_priority_scope
(
cg
,
-
(
2
**
30
)):
# always run all_reduce_mean first except add_update
grad
=
(
...
...
@@ -230,10 +230,14 @@ class Optimizer(metaclass=ABCMeta):
key
=
0
for
group
in
self
.
param_groups
:
for
param
in
group
[
"params"
]:
bcast_param
(
param
,
"bcast_param_"
+
str
(
key
),
get_world_size
(),
get_rank
()
==
0
,
)
key
+=
1
if
param
.
replica_mode
:
bcast_param
(
param
,
"bcast_param_"
+
str
(
key
),
get_world_size
(),
get_rank
()
==
0
,
)
key
+=
1
def
state_dict
(
self
)
->
Dict
:
r
"""Export the optimizer state.
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录