Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
2ed85a39
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
大约 1 年 前同步成功
通知
109
Star
5997
Fork
1270
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
2ed85a39
编写于
4月 09, 2019
作者:
Y
Yibing Liu
提交者:
GitHub
4月 09, 2019
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #81 from PaddlePaddle/improve_squad
Don't use persistable for fetched variables
上级
77ab80a7
316a3b3f
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
3 addition
and
6 deletion
+3
-6
BERT/run_squad.py
BERT/run_squad.py
+3
-6
未找到文件。
BERT/run_squad.py
浏览文件 @
2ed85a39
...
@@ -144,9 +144,6 @@ def create_model(pyreader_name, bert_config, is_training=False):
...
@@ -144,9 +144,6 @@ def create_model(pyreader_name, bert_config, is_training=False):
batch_ones
=
fluid
.
layers
.
fill_constant_batch_size_like
(
batch_ones
=
fluid
.
layers
.
fill_constant_batch_size_like
(
input
=
start_logits
,
dtype
=
'int64'
,
shape
=
[
1
],
value
=
1
)
input
=
start_logits
,
dtype
=
'int64'
,
shape
=
[
1
],
value
=
1
)
num_seqs
=
fluid
.
layers
.
reduce_sum
(
input
=
batch_ones
)
num_seqs
=
fluid
.
layers
.
reduce_sum
(
input
=
batch_ones
)
num_seqs
.
persistable
=
True
start_logits
.
persistable
=
True
end_logits
.
persistable
=
True
if
is_training
:
if
is_training
:
...
@@ -161,7 +158,6 @@ def create_model(pyreader_name, bert_config, is_training=False):
...
@@ -161,7 +158,6 @@ def create_model(pyreader_name, bert_config, is_training=False):
total_loss
=
(
start_loss
+
end_loss
)
/
2.0
total_loss
=
(
start_loss
+
end_loss
)
/
2.0
if
args
.
use_fp16
and
args
.
loss_scaling
>
1.0
:
if
args
.
use_fp16
and
args
.
loss_scaling
>
1.0
:
total_loss
=
total_loss
*
args
.
loss_scaling
total_loss
=
total_loss
*
args
.
loss_scaling
total_loss
.
persistable
=
True
return
pyreader
,
total_loss
,
num_seqs
return
pyreader
,
total_loss
,
num_seqs
else
:
else
:
...
@@ -282,7 +278,7 @@ def train(args):
...
@@ -282,7 +278,7 @@ def train(args):
use_fp16
=
args
.
use_fp16
,
use_fp16
=
args
.
use_fp16
,
loss_scaling
=
args
.
loss_scaling
)
loss_scaling
=
args
.
loss_scaling
)
fluid
.
memory_optimize
(
train_program
)
fluid
.
memory_optimize
(
train_program
,
skip_opt_set
=
[
loss
.
name
,
num_seqs
.
name
]
)
if
args
.
verbose
:
if
args
.
verbose
:
if
args
.
in_tokens
:
if
args
.
in_tokens
:
...
@@ -304,7 +300,8 @@ def train(args):
...
@@ -304,7 +300,8 @@ def train(args):
bert_config
=
bert_config
,
bert_config
=
bert_config
,
is_training
=
False
)
is_training
=
False
)
fluid
.
memory_optimize
(
test_prog
)
fluid
.
memory_optimize
(
test_prog
,
skip_opt_set
=
[
unique_ids
.
name
,
start_logits
.
name
,
end_logits
.
name
,
num_seqs
.
name
])
test_prog
=
test_prog
.
clone
(
for_test
=
True
)
test_prog
=
test_prog
.
clone
(
for_test
=
True
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录