Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Oneflow-Inc
OneFlow-Benchmark
提交
40cea1e4
O
OneFlow-Benchmark
项目概览
Oneflow-Inc
/
OneFlow-Benchmark
上一次同步 接近 3 年
通知
1
Star
92
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
O
OneFlow-Benchmark
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
40cea1e4
编写于
3月 14, 2020
作者:
S
ShawnXuan
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
support multi nodes
上级
519bbc50
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
5 addition
and
6 deletion
+5
-6
cnn_e2e/of_cnn_train_val.py
cnn_e2e/of_cnn_train_val.py
+0
-4
cnn_e2e/util.py
cnn_e2e/util.py
+3
-2
of_e2e.sh
of_e2e.sh
+2
-0
未找到文件。
cnn_e2e/of_cnn_train_val.py
浏览文件 @
40cea1e4
...
...
@@ -13,7 +13,6 @@ args = parser.parse_args()
configs
.
print_args
(
args
)
from
util
import
Snapshot
,
Summary
,
InitNodes
,
Metric
#from dali_util import get_rec_iter
import
ofrecord_util
from
job_function_util
import
get_train_config
,
get_val_config
import
oneflow
as
flow
...
...
@@ -99,9 +98,6 @@ def main():
for
i
in
range
(
num_val_steps
):
InferenceNet
().
async_get
(
metric
.
metric_cb
(
epoch
,
i
))
#summary.save()
#snapshot.save('epoch_{}'.format(epoch+1))
if
__name__
==
"__main__"
:
main
()
cnn_e2e/util.py
浏览文件 @
40cea1e4
...
...
@@ -13,10 +13,11 @@ import oneflow as flow
def
InitNodes
(
args
):
if
args
.
num_nodes
>
1
:
assert
args
.
num_nodes
<=
len
(
args
.
node_ips
)
flow
.
env
.
ctrl_port
(
12138
)
nodes
=
[]
for
n
in
args
.
node_list
.
strip
().
split
(
","
)
:
for
ip
in
args
.
node_ips
:
addr_dict
=
{}
addr_dict
[
"addr"
]
=
n
addr_dict
[
"addr"
]
=
ip
nodes
.
append
(
addr_dict
)
flow
.
env
.
machine
(
nodes
)
...
...
of_e2e.sh
浏览文件 @
40cea1e4
...
...
@@ -9,6 +9,8 @@ DATA_ROOT=/dataset/ImageNet/ofrecord
--train_data_part_num
=
256
\
--val_data_dir
=
$DATA_ROOT
/validation
\
--val_data_part_num
=
256
\
--num_nodes
=
2
\
--node_ips
=
'11.11.1.13,11.11.1.14'
\
--gpu_num_per_node
=
4
\
--optimizer
=
"momentum-cosine-decay"
\
--learning_rate
=
0.256
\
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录