Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
cf4c6fb4
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
cf4c6fb4
编写于
7月 02, 2021
作者:
W
WangXi
提交者:
GitHub
7月 02, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix shared param grad_add op_device is null (#33875)
上级
9b48199a
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
9 addition
and
5 deletion
+9
-5
python/paddle/fluid/backward.py
python/paddle/fluid/backward.py
+9
-5
未找到文件。
python/paddle/fluid/backward.py
浏览文件 @
cf4c6fb4
...
@@ -462,6 +462,7 @@ def _addup_repetitive_outputs_(op_descs, block_idx):
...
@@ -462,6 +462,7 @@ def _addup_repetitive_outputs_(op_descs, block_idx):
var_rename_count
=
collections
.
defaultdict
(
int
)
var_rename_count
=
collections
.
defaultdict
(
int
)
renamed_vars
=
collections
.
defaultdict
(
list
)
renamed_vars
=
collections
.
defaultdict
(
list
)
renamed_var_start_idx
=
collections
.
defaultdict
(
list
)
renamed_var_start_idx
=
collections
.
defaultdict
(
list
)
var_device
=
collections
.
defaultdict
(
str
)
for
idx
,
op_desc
in
enumerate
(
op_descs
):
for
idx
,
op_desc
in
enumerate
(
op_descs
):
op_device_attr_name
=
core
.
op_proto_and_checker_maker
.
kOpDeviceAttrName
(
op_device_attr_name
=
core
.
op_proto_and_checker_maker
.
kOpDeviceAttrName
(
)
)
...
@@ -528,16 +529,19 @@ def _addup_repetitive_outputs_(op_descs, block_idx):
...
@@ -528,16 +529,19 @@ def _addup_repetitive_outputs_(op_descs, block_idx):
arg_names
[
arg_idx
]
=
new_name
arg_names
[
arg_idx
]
=
new_name
op_desc
.
set_output
(
param_name
,
arg_names
)
op_desc
.
set_output
(
param_name
,
arg_names
)
renamed_vars
[
var_name
].
append
(
new_name
)
renamed_vars
[
var_name
].
append
(
new_name
)
# record the latest device, for shared param
var_device
[
var_name
]
=
op_device
for
var_name
,
inputs
in
six
.
iteritems
(
renamed_vars
):
for
var_name
,
inputs
in
six
.
iteritems
(
renamed_vars
):
if
len
(
renamed_vars
[
var_name
])
>
1
:
if
len
(
renamed_vars
[
var_name
])
>
1
:
if
len
(
renamed_vars
[
var_name
])
>
_MAX_ADD_NUM_
:
if
len
(
renamed_vars
[
var_name
])
>
_MAX_ADD_NUM_
:
_accumulate_gradients_by_sum_op_
(
var_name
,
renamed_vars
,
_accumulate_gradients_by_sum_op_
(
pending_sum_ops
,
len
(
op_descs
))
var_name
,
renamed_vars
,
pending_sum_ops
,
len
(
op_descs
),
var_device
[
var_name
])
else
:
else
:
_accumulate_gradients_by_add_ops_
(
var_name
,
renamed_vars
,
_accumulate_gradients_by_add_ops_
(
pending_sum_ops
,
var_name
,
renamed_vars
,
pending_sum_ops
,
len
(
op_descs
)
)
len
(
op_descs
),
var_device
[
var_name
]
)
# sum_op descs are sorted according to their insert position
# sum_op descs are sorted according to their insert position
for
key
,
value
in
collections
.
OrderedDict
(
for
key
,
value
in
collections
.
OrderedDict
(
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录