Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
d45d17fb
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
大约 1 年 前同步成功
通知
109
Star
5997
Fork
1270
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
d45d17fb
编写于
6月 21, 2019
作者:
C
chengduozh
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
support multi-process for bert
上级
7803d896
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
11 addition
and
5 deletion
+11
-5
BERT/reader/cls.py
BERT/reader/cls.py
+4
-1
BERT/run_classifier.py
BERT/run_classifier.py
+7
-4
未找到文件。
BERT/reader/cls.py
浏览文件 @
d45d17fb
...
...
@@ -123,7 +123,8 @@ class DataProcessor(object):
phase
=
'train'
,
epoch
=
1
,
dev_count
=
1
,
shuffle
=
True
):
shuffle
=
True
,
shuffle_seed
=
None
):
"""
Generate data for train, dev or test.
...
...
@@ -149,6 +150,8 @@ class DataProcessor(object):
def
instance_reader
():
for
epoch_index
in
range
(
epoch
):
if
shuffle
:
if
shuffle_seed
is
not
None
:
np
.
random
.
seed
(
shuffle_seed
)
np
.
random
.
shuffle
(
examples
)
if
phase
==
'train'
:
self
.
current_train_epoch
=
epoch_index
...
...
BERT/run_classifier.py
浏览文件 @
d45d17fb
...
...
@@ -159,15 +159,17 @@ def main(args):
train_program
.
random_seed
=
args
.
random_seed
if
args
.
do_train
:
# NOTE: do not shuffle dataset when using multi-process training.
if
num_trainers
>
1
:
args
.
shuffle
=
False
# NOTE: If num_trainers > 1, the shuffle_seed must be set, because
# the order of batch data generated by reader
# must be the same in the respective processes.
shuffle_seed
=
1
if
num_trainers
>
1
else
None
train_data_generator
=
processor
.
data_generator
(
batch_size
=
args
.
batch_size
,
phase
=
'train'
,
epoch
=
args
.
epoch
,
dev_count
=
dev_count
,
shuffle
=
args
.
shuffle
)
shuffle
=
args
.
shuffle
,
shuffle_seed
=
shuffle_seed
)
num_train_examples
=
processor
.
get_num_examples
(
phase
=
'train'
)
...
...
@@ -268,6 +270,7 @@ def main(args):
build_strategy
=
fluid
.
BuildStrategy
()
if
args
.
use_cuda
and
num_trainers
>
1
:
assert
shuffle_seed
is
not
None
dist_utils
.
prepare_for_multi_process
(
exe
,
build_strategy
,
train_program
)
train_data_generator
=
fluid
.
contrib
.
reader
.
distributed_batch_reader
(
train_data_generator
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录