Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
magicwindyyd
mindspore
提交
b69b1ca8
M
mindspore
项目概览
magicwindyyd
/
mindspore
与 Fork 源项目一致
Fork自
MindSpore / mindspore
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
mindspore
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
b69b1ca8
编写于
8月 21, 2020
作者:
M
mindspore-ci-bot
提交者:
Gitee
8月 21, 2020
浏览文件
操作
浏览文件
下载
差异文件
!4830 [gpu] fix continuous allreduces bug
Merge pull request !4830 from yuchaojie/gpu_allreduce
上级
29e21479
61bf4b18
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
19 addition
and
9 deletion
+19
-9
mindspore/ccsrc/runtime/device/gpu/gpu_stream_assign.cc
mindspore/ccsrc/runtime/device/gpu/gpu_stream_assign.cc
+17
-8
mindspore/ccsrc/runtime/device/gpu/gpu_stream_assign.h
mindspore/ccsrc/runtime/device/gpu/gpu_stream_assign.h
+2
-1
未找到文件。
mindspore/ccsrc/runtime/device/gpu/gpu_stream_assign.cc
浏览文件 @
b69b1ca8
...
...
@@ -74,9 +74,11 @@ bool FindAllReduceStreamSwitchPos(const std::shared_ptr<session::KernelGraph> &k
MS_LOG
(
WARNING
)
<<
"Can't find send node place before AllReduce node."
;
continue
;
}
SendRecvPair
pair1
=
{
kAllReduceStreamSwitch
,
*
mock_send_node_iter
,
*
iter
,
IntToSize
(
mock_send_node_iter
-
iter_begin
+
1
),
IntToSize
(
iter
-
iter_begin
)};
send_recv_pairs
->
push_back
(
pair1
);
if
(
AnfAlgo
::
GetCNodeName
(
*
mock_send_node_iter
)
!=
kAllReduceOpName
)
{
SendRecvPair
pair1
=
{
kAllReduceStreamSwitch
,
*
mock_send_node_iter
,
*
iter
,
IntToSize
(
mock_send_node_iter
-
iter_begin
+
1
),
IntToSize
(
iter
-
iter_begin
)};
send_recv_pairs
->
push_back
(
pair1
);
}
// Find node which uses AllReduce as input[0].
std
::
vector
<
CNodePtr
>::
iterator
mock_recv_node_iter
=
FindRecvNodePos
(
iter
,
iter_end
,
*
iter
,
kAllReduceStreamSwitch
);
...
...
@@ -84,9 +86,11 @@ bool FindAllReduceStreamSwitchPos(const std::shared_ptr<session::KernelGraph> &k
MS_LOG
(
WARNING
)
<<
"Can't find recv node place after AllReduce node."
;
return
false
;
}
SendRecvPair
pair2
=
{
kAllReduceStreamSwitch
,
*
iter
,
*
mock_recv_node_iter
,
IntToSize
(
iter
-
iter_begin
+
1
),
IntToSize
(
mock_recv_node_iter
-
iter_begin
)};
send_recv_pairs
->
push_back
(
pair2
);
if
(
AnfAlgo
::
GetCNodeName
(
*
mock_recv_node_iter
)
!=
kAllReduceOpName
)
{
SendRecvPair
pair2
=
{
kAllReduceStreamSwitch
,
*
iter
,
*
mock_recv_node_iter
,
IntToSize
(
iter
-
iter_begin
+
1
),
IntToSize
(
mock_recv_node_iter
-
iter_begin
)};
send_recv_pairs
->
push_back
(
pair2
);
}
}
}
return
true
;
...
...
@@ -110,17 +114,22 @@ std::vector<CNodePtr>::iterator FindRecvNodePos(std::vector<CNodePtr>::iterator
std
::
vector
<
CNodePtr
>::
iterator
end
,
const
CNodePtr
mock_send_node
,
StreamSwitchType
stream_switch_type
)
{
MS_EXCEPTION_IF_NULL
(
mock_send_node
);
auto
ret
=
end
;
for
(
auto
iter
=
begin
;
iter
!=
end
;
iter
++
)
{
auto
node
=
*
iter
;
if
(
stream_switch_type
==
kAllReduceStreamSwitch
)
{
for
(
auto
input
:
node
->
inputs
())
{
if
(
mock_send_node
==
AnfAlgo
::
VisitKernel
(
input
,
0
).
first
)
{
return
iter
;
if
(
AnfAlgo
::
GetCNodeName
(
node
)
!=
kAllReduceOpName
)
{
return
iter
;
}
else
if
(
ret
==
end
)
{
ret
=
iter
;
}
}
}
}
}
return
end
;
return
ret
;
}
void
InsertStreamSwitchNode
(
const
std
::
shared_ptr
<
session
::
KernelGraph
>
&
kernel_graph
,
...
...
mindspore/ccsrc/runtime/device/gpu/gpu_stream_assign.h
浏览文件 @
b69b1ca8
...
...
@@ -41,7 +41,8 @@ struct StreamSwitchNode {
if
(
offset
<
n
.
offset
)
{
return
true
;
}
else
if
(
offset
==
n
.
offset
)
{
return
AnfAlgo
::
GetCNodeName
(
cnode
)
==
kSendOpName
?
true
:
false
;
return
(
AnfAlgo
::
GetCNodeName
(
cnode
)
==
kRecvOpName
&&
AnfAlgo
::
GetCNodeName
(
n
.
cnode
)
==
kSendOpName
)
?
false
:
true
;
}
else
{
return
false
;
}
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录