Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
fd616fad
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
fd616fad
编写于
9月 30, 2020
作者:
T
tangwei12
提交者:
GitHub
9月 30, 2020
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
repen heartbeat ut (#27684)
上级
f373269d
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
25 addition
and
27 deletion
+25
-27
paddle/fluid/operators/distributed/heart_beat_monitor.cc
paddle/fluid/operators/distributed/heart_beat_monitor.cc
+1
-1
paddle/fluid/operators/distributed/heart_beat_monitor_test.cc
...le/fluid/operators/distributed/heart_beat_monitor_test.cc
+24
-26
未找到文件。
paddle/fluid/operators/distributed/heart_beat_monitor.cc
浏览文件 @
fd616fad
...
...
@@ -84,7 +84,7 @@ void HeartBeatMonitor::LostWorkerMonitor() {
}
}
std
::
this_thread
::
sleep_for
(
std
::
chrono
::
milliseconds
(
3
0
*
1000
));
std
::
this_thread
::
sleep_for
(
std
::
chrono
::
milliseconds
(
1
0
*
1000
));
}
VLOG
(
1
)
<<
"worker heartbeat monitor stopped, thread exit"
;
}
...
...
paddle/fluid/operators/distributed/heart_beat_monitor_test.cc
浏览文件 @
fd616fad
...
...
@@ -23,32 +23,30 @@ namespace distributed {
void
run
(
HeartBeatMonitor
*
monitor
)
{
monitor
->
LostWorkerMonitor
();
}
TEST
(
HeartBeatMonitor
,
All
)
{
// (tangwei12) fix it soon.
return
;
// int trainers = 10;
// int pserver_id = 0;
// std::string var = "nce_w@GRAD.block0";
// std::string var2 = "nce_w@GRAD.block2";
//
// HeartBeatMonitor::Init(trainers, pserver_id == 0, var);
//
// auto* monitor = HeartBeatMonitor::GetInstance();
//
// std::vector<int> ids{1, 3, 5, 7};
//
// for (auto& id : ids) {
// monitor->Update(id, var, RUNNING);
// }
//
// monitor->Update(9, var2, RUNNING);
// monitor->Update(2, var, COMPLETED);
//
// std::thread t(run, monitor);
// t.detach();
//
// std::this_thread::sleep_for(std::chrono::milliseconds(45 * 1000));
//
// monitor->Stop();
int
trainers
=
10
;
int
pserver_id
=
0
;
std
::
string
var
=
"nce_w@GRAD.block0"
;
std
::
string
var2
=
"nce_w@GRAD.block2"
;
HeartBeatMonitor
::
Init
(
trainers
,
pserver_id
==
0
,
var
);
auto
*
monitor
=
HeartBeatMonitor
::
GetInstance
();
std
::
vector
<
int
>
ids
{
1
,
3
,
5
,
7
};
for
(
auto
&
id
:
ids
)
{
monitor
->
Update
(
id
,
var
,
RUNNING
);
}
monitor
->
Update
(
9
,
var2
,
RUNNING
);
monitor
->
Update
(
2
,
var
,
COMPLETED
);
std
::
thread
t
(
run
,
monitor
);
t
.
detach
();
std
::
this_thread
::
sleep_for
(
std
::
chrono
::
milliseconds
(
15
*
1000
));
monitor
->
Stop
();
}
}
// namespace distributed
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录