Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
models
提交
3a33a0bb
M
models
项目概览
PaddlePaddle
/
models
大约 1 年 前同步成功
通知
222
Star
6828
Fork
2962
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
602
列表
看板
标记
里程碑
合并请求
255
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
models
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
602
Issue
602
列表
看板
标记
里程碑
合并请求
255
合并请求
255
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
3a33a0bb
编写于
8月 22, 2019
作者:
0
0YuanZhang0
提交者:
GitHub
8月 22, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix_qa_test_question (#3169)
上级
85ca049c
变更
13
显示空白变更内容
内联
并排
Showing
13 changed file
with
164 addition
and
53 deletion
+164
-53
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/README.md
...dialogue_model_toolkit/auto_dialogue_evaluation/README.md
+44
-24
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/ade/reader.py
...ogue_model_toolkit/auto_dialogue_evaluation/ade/reader.py
+10
-1
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/predict.py
...ialogue_model_toolkit/auto_dialogue_evaluation/predict.py
+2
-0
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/run.sh
...LP/dialogue_model_toolkit/auto_dialogue_evaluation/run.sh
+12
-0
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/train.py
.../dialogue_model_toolkit/auto_dialogue_evaluation/train.py
+8
-2
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/README.md
...ue_model_toolkit/dialogue_general_understanding/README.md
+47
-8
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/data/config/dgu.yaml
...olkit/dialogue_general_understanding/data/config/dgu.yaml
+0
-1
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/dgu/reader.py
...odel_toolkit/dialogue_general_understanding/dgu/reader.py
+32
-10
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/dgu/utils/configure.py
...kit/dialogue_general_understanding/dgu/utils/configure.py
+0
-2
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/dgu_net.py
...e_model_toolkit/dialogue_general_understanding/dgu_net.py
+1
-1
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/predict.py
...e_model_toolkit/dialogue_general_understanding/predict.py
+2
-1
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/run.sh
...logue_model_toolkit/dialogue_general_understanding/run.sh
+5
-2
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/train.py
...gue_model_toolkit/dialogue_general_understanding/train.py
+1
-1
未找到文件。
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/README.md
浏览文件 @
3a33a0bb
# 对话自动评估模块ADE
*
[
1、模型简介
](
#1、模型简介
)
*
[
2、快速开始
](
#2、快速开始
)
*
[
3、进阶使用
](
#3、进阶使用
)
*
[
4、参考论文
](
#4、参考论文
)
*
[
5、版本更新
](
#5、版本更新
)
-
[
**1、模型简介**
](
#1、模型简介
)
-
[
**2、快速开始**
](
#2、快速开始
)
-
[
**3、进阶使用**
](
#3、进阶使用
)
-
[
**4、参考论文**
](
#4、参考论文
)
-
[
**5、版本更新**
](
#5、版本更新
)
## 1、模型简介
...
...
@@ -40,9 +44,11 @@ cd models/PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation
    
本模块内模型训练主要包括两个阶段:
    
1)第一阶段:训练一个匹配模型作为评估工具,可用于待评估对话系统内的回复内容进行排序;(matching任务)
    
1)第一阶段:训练一个匹配模型作为评估工具,可用于待评估对话系统内的回复内容进行排序;(matching任务)
          
模型结构: 输入为context和response, 对两个输入学习embedding表示, 学习到的表示经过lstm学习高阶表示, context和response的高阶表示计算双线性张量积logits, logits和label计算sigmoid_cross_entropy_with_logits loss;
    
2)第二阶段:利用少量的对话系统的标记数据,对第一阶段训练的匹配模型进行finetuning, 可以提高评估效果(包含human,keywords,seq2seq_att,seq2seq_naive,4个finetuning任务);
          
模型结构: finetuning阶段学习表示到计算logits部分和第一阶段模型结构相同,区别在于finetuning阶段计算square_error_cost loss;
    
用于第二阶段fine-tuning的对话系统包括下面四部分:
...
...
@@ -74,6 +80,8 @@ label_data(第二阶段finetuning数据集)
cd ade && bash prepare_data_and_model.sh
```
    
数据路径:data/input/data/
    
模型路径:data/saved_models/trained_models/
    
下载经过预处理的数据,运行该脚本之后,data目录下会存在unlabel_data(train.ids/val.ids/test.ids),lable_data: human、keywords、seq2seq_att、seq2seq_naive(四个任务数据train.ids/val.ids/test.ids),以及word2ids.
### 单机训练
...
...
@@ -84,14 +92,14 @@ cd ade && bash prepare_data_and_model.sh
bash run.sh matching train
```
    
方式一
如果为CPU训练:
    
如果为CPU训练:
```
请将run.sh内参数设置为:
1、export CUDA_VISIBLE_DEVICES=
```
    
方式一
如果为GPU训练:
    
如果为GPU训练:
```
请将run.sh内参数设置为:
...
...
@@ -121,6 +129,12 @@ else
fi
pretrain_model_path="data/saved_models/matching_pretrained"
if [ -f ${pretrain_model_path} ]
then
rm ${pretrain_model_path}
fi
if [ ! -d ${pretrain_model_path} ]
then
mkdir ${pretrain_model_path}
...
...
@@ -181,6 +195,12 @@ else
fi
save_model_path="data/saved_models/human_finetuned"
if [ -f ${save_model_path} ]
then
rm ${save_model_path}
fi
if [ ! -d ${save_model_path} ]
then
mkdir ${save_model_path}
...
...
@@ -215,14 +235,14 @@ python -u main.py \
bash run.sh matching predict
```
    
方式一
如果为CPU预测:
    
如果为CPU预测:
```
请将run.sh内参数设置为:
export CUDA_VISIBLE_DEVICES=
```
    
方式一
如果为GPU预测:
    
如果为GPU预测:
```
请将run.sh内参数设置为:
...
...
@@ -329,23 +349,23 @@ seq2seq_naive:使用spearman相关系数来衡量评估模型对系统的打
    
1. 无标注数据情况下,直接使用预训练好的评估工具进行评估;
在四个对话系统上,自动评估打分和人工评估打分spearman相关系数,如下:
        
在四个对话系统上,自动评估打分和人工评估打分spearman相关系数,如下:
/|seq2seq\_naive|seq2seq\_att|keywords|human
--|:--:|--:|:--:|--:
cor|0.361|0.343|0.324|0.288
||seq2seq
\_
naive|seq2seq
\_
att|keywords|human|
|--|:--:|--:|:--:|--:|
|cor|0.361|0.343|0.324|0.288|
对四个系统平均得分排序:
        
对四个系统平均得分排序:
人工评估|k(0.591)<n(0.847)<a(1.116)<h(1.240)
--|--:
自动评估|k(0.625)<n(0.909)<a(1.399)<h(1.683)
|人工评估|k(0.591)<n(0.847)<a(1.116)<h(1.240)|
|--|--:|
|自动评估|k(0.625)<n(0.909)<a(1.399)<h(1.683)|
    
2. 利用少量标注数据微调后,自动评估打分和人工打分spearman相关系数,如下:
/|seq2seq\_naive|seq2seq\_att|keywords|human
--|:--:|--:|:--:|--:
cor|0.474|0.477|0.443|0.378
||seq2seq
\_
naive|seq2seq
\_
att|keywords|human|
|--|:--:|--:|:--:|--:|
|cor|0.474|0.477|0.443|0.378|
#### 1、第一阶段matching模型的评估:
####     方式一: 推荐直接使用模块内脚本评估
...
...
@@ -404,14 +424,14 @@ python -u main.py \
bash run.sh matching inference
```
    
方式一
如果为CPU执行inference model过程:
    
如果为CPU执行inference model过程:
```
请将run.sh内参数设置为:
export CUDA_VISIBLE_DEVICES=
```
    
方式一
如果为GPU执行inference model过程:
    
如果为GPU执行inference model过程:
```
请将run.sh内参数设置为:
...
...
@@ -496,7 +516,7 @@ python -u main.py \
    
模型中所需数据格式如下:
    
训练、预测、评估使用的数据示例如下,数据由三列组成,以制表符('
\t
')分隔,第一列是以空格分开的上文id
,第二列是以空格分开的回复id,第三列是标签
    
训练、预测、评估使用的数据示例如下,数据由三列组成,以制表符('
\t
')分隔,第一列是以空格分开的上文id
(即context),第二列是以空格分开的回复id(即response),第三列是标签(标签含义:2-完全匹配,1-部分匹配,0-不匹配)。
```
723 236 7823 12 8 887 13 77 4 2
...
...
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/ade/reader.py
浏览文件 @
3a33a0bb
...
...
@@ -33,8 +33,12 @@ class DataProcessor(object):
def
get_examples
(
self
):
"""load examples"""
examples
=
[]
index
=
0
with
open
(
self
.
data_file
,
'r'
)
as
fr
:
for
line
in
fr
:
if
index
!=
0
and
index
%
100
==
0
:
print
(
"processing data: %d"
%
index
)
index
+=
1
examples
.
append
(
line
.
strip
())
return
examples
...
...
@@ -72,7 +76,12 @@ class DataProcessor(object):
if
random
.
random
()
>
sample_pro
:
continue
tokens
=
example
.
strip
().
split
(
'
\t
'
)
assert
len
(
tokens
)
==
3
if
len
(
tokens
)
!=
3
:
print
(
"data format error: %s"
%
example
.
strip
())
print
(
"please input data: context
\t
response
\t
label"
)
continue
context
=
[
int
(
x
)
for
x
in
tokens
[
0
].
split
()[:
self
.
max_seq_len
]]
response
=
[
int
(
x
)
for
x
in
tokens
[
1
].
split
()[:
self
.
max_seq_len
]]
label
=
[
int
(
tokens
[
2
])]
...
...
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/predict.py
浏览文件 @
3a33a0bb
...
...
@@ -108,9 +108,11 @@ def do_predict(args):
break
scores
=
scores
[:
num_test_examples
]
print
(
"Write the predicted results into the output_prediction_file"
)
with
open
(
args
.
output_prediction_file
,
'w'
)
as
fw
:
for
index
,
score
in
enumerate
(
scores
):
fw
.
write
(
"%s
\t
%s
\n
"
%
(
index
,
score
))
print
(
"finish........................................"
)
if
__name__
==
"__main__"
:
...
...
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/run.sh
浏览文件 @
3a33a0bb
...
...
@@ -51,6 +51,11 @@ function pretrain_train()
{
pretrain_model_path
=
"
${
SAVED_MODELS
}
/matching_pretrained"
if
[
-f
${
pretrain_model_path
}
]
then
rm
${
pretrain_model_path
}
fi
if
[
!
-d
${
pretrain_model_path
}
]
then
mkdir
${
pretrain_model_path
}
...
...
@@ -78,10 +83,17 @@ function pretrain_train()
function
finetuning_train
()
{
save_model_path
=
"
${
SAVED_MODELS
}
/
${
2
}
_finetuned"
if
[
-f
${
save_model_path
}
]
then
rm
${
save_model_path
}
fi
if
[
!
-d
${
save_model_path
}
]
then
mkdir
${
save_model_path
}
fi
${
PYTHON_PATH
}
-u
main.py
\
--do_train
=
true
\
--use_cuda
=
${
1
}
\
...
...
PaddleNLP/dialogue_model_toolkit/auto_dialogue_evaluation/train.py
浏览文件 @
3a33a0bb
...
...
@@ -129,6 +129,7 @@ def do_train(args):
steps
=
0
begin_time
=
time
.
time
()
time_begin
=
time
.
time
()
for
epoch_step
in
range
(
args
.
epoch
):
data_reader
.
start
()
...
...
@@ -136,7 +137,6 @@ def do_train(args):
ce_loss
=
0.0
while
True
:
try
:
steps
+=
1
fetch_list
=
[
loss
.
name
]
outputs
=
exe
.
run
(
compiled_train_prog
,
fetch_list
=
fetch_list
)
np_loss
=
outputs
...
...
@@ -144,14 +144,20 @@ def do_train(args):
ce_loss
=
np
.
array
(
np_loss
).
mean
()
if
steps
%
args
.
print_steps
==
0
:
print
(
'epoch: %d, step: %s, avg loss %s'
%
(
epoch_step
,
steps
,
sum_loss
/
args
.
print_steps
))
time_end
=
time
.
time
()
used_time
=
time_end
-
time_begin
current_time
=
time
.
strftime
(
'%Y-%m-%d %H:%M:%S'
,
time
.
localtime
(
time
.
time
()))
print
(
'%s epoch: %d, step: %s, avg loss %s, speed: %f steps/s'
%
(
current_time
,
epoch_step
,
steps
,
sum_loss
/
args
.
print_steps
,
args
.
print_steps
/
used_time
))
sum_loss
=
0.0
time_begin
=
time
.
time
()
if
steps
%
args
.
save_steps
==
0
:
if
args
.
save_checkpoint
:
save_load_io
.
save_checkpoint
(
args
,
exe
,
train_prog
,
"step_"
+
str
(
steps
))
if
args
.
save_param
:
save_load_io
.
save_param
(
args
,
exe
,
train_prog
,
"step_"
+
str
(
steps
))
steps
+=
1
except
fluid
.
core
.
EOFException
:
data_reader
.
reset
()
break
...
...
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/README.md
浏览文件 @
3a33a0bb
# 对话通用理解模块DGU
*
[
1、模型简介
](
#1、模型简介
)
*
[
2、快速开始
](
#2、快速开始
)
*
[
3、进阶使用
](
#3、进阶使用
)
*
[
4、参考论文
](
#4、参考论文
)
*
[
5、版本更新
](
#5、版本更新
)
-
[
**1、模型简介**
](
#1、模型简介
)
-
[
**2、快速开始**
](
#2、快速开始
)
-
[
**3、进阶使用**
](
#3、进阶使用
)
-
[
**4、参考论文**
](
#4、参考论文
)
-
[
**5、版本更新**
](
#5、版本更新
)
## 1、模型简介
...
...
@@ -60,6 +64,10 @@ SWDA:Switchboard Dialogue Act Corpus;
```
cd dgu && bash prepare_data_and_model.sh
```
    
数据路径:data/input/data
    
预训练模型路径:data/pretrain_model
    
已训练模型路径:data/saved_models/trained_models
    
下载的数据集中已提供了训练集,测试集和验证集,用户如果需要重新生成某任务数据集的训练数据,可执行:
...
...
@@ -67,6 +75,34 @@ cd dgu && bash prepare_data_and_model.sh
cd dgu/scripts && bash run_build_data.sh task_name
参数说明:
task_name: udc, swda, mrda, atis, dstc2, 选择5个数据集选项中用户需要生成的数据名
各任务数据生成脚本描述:
dgu/scripts/build_atis_dataset.py:将ATIS开源数据集转换成训练所需的意图识别(atis_intent)和槽位解析(atis_slot)训练数据
dgu/scripts/build_dstc2_dataset.py:将DSTC2开源数据集转换成训练所需数据格式;
dgu/scripts/build_mrda_dataset.py:将MRDA开源数据集转换成训练所需数据格式;
dgu/scripts/build_swda_dataset.py:将SWDA开源数据集转换成训练所需数据格式;
```
    
根据脚本构造的训练数据格式说明:
```
udc:数据组成,label和多轮对话(分为多轮上文和当前回复),整体分割符为"\t"
format: label \t conv1 \t conv2 \t conv3 \t ......\t response
swda:数据组成,多轮对话id, 标签label, 发言人caller, 说话内容conversation_content,整体分割符为"\t"
format: conversation_id \t label \t caller \t conversation_content
mrda: 数据组成,多轮对话id, 标签label, 发言人caller, 说话内容conversation_content,整体分割符为"\t"
format: conversation_id \t label \t caller \t conversation_content
atis/atis_intent: 数据组成,标签label, 说话内容conversation_content,整体分割符为"\t"
format: label \t conversation_content
atis/atis_slot: 数据组成,说话内容conversation_content,标签序列 label_list(空格分割), 其中标签和说话内容中token为一一对应关系,整体分割符为"\t"
format: conversation_content \t label1 label2 label3
dstc2/dstc2: 数据组成,多轮对话id, 当前轮QA对(使用\1拼接),标签(识别到的对话状态,从对话初始状态到当前轮累计的标签集合, 空格分割),整体分割符为"\t"
format:conversation_content \t question \1 answer \t state1 state2 state3......
```
### 单机训练
...
...
@@ -119,6 +155,10 @@ fi
TASK_NAME="atis_intent" #指定训练的任务名称
BERT_BASE_PATH="data/pretrain_model/uncased_L-12_H-768_A-12"
if [ -f "./data/saved_models/${TASK_NAME}" ]; then
rm "./data/saved_models/${TASK_NAME}"
fi
if [ ! -d "./data/saved_models/${TASK_NAME}" ]; then
mkdir "./data/saved_models/${TASK_NAME}"
fi
...
...
@@ -141,8 +181,7 @@ python -u main.py \
--learning_rate=2e-5 \
--weight_decay=0.01 \
--max_seq_len=128 \
--print_steps=10 \
--use_fp16 false
--print_steps=10
```
注:
...
...
@@ -350,7 +389,7 @@ python -u main.py \
[CLS] token11 token12 token13 [INNER_SEP] token11 token12 token13 [SEP] token21 token22 token23 [SEP] token31 token32 token33 [SEP]
```
    
输入数据以[CLS]开始,[SEP]分割
内容为对话内容相关三部分,如上文,当前句,下文等,如
[SEP]分割的每部分内部由多轮组成的话,使用[INNER_SEP]进行分割;第二部分和第三部分部分皆可缺省;
    
输入数据以[CLS]开始,[SEP]分割
对话内容(上文、当前句、下文等),如果
[SEP]分割的每部分内部由多轮组成的话,使用[INNER_SEP]进行分割;第二部分和第三部分部分皆可缺省;
    
目前dialogue_general_understanding模块内已将数据准备部分集成到代码内,用户可根据上面输入数据格式,组装自己的数据;
...
...
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/data/config/dgu.yaml
浏览文件 @
3a33a0bb
...
...
@@ -24,7 +24,6 @@ verbose: False
do_lower_case
:
False
random_seed
:
0
use_cuda
:
True
task_name
:
"
"
in_tokens
:
False
do_save_inference_model
:
False
enable_ce
:
"
"
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/dgu/reader.py
浏览文件 @
3a33a0bb
...
...
@@ -14,9 +14,11 @@
"""data reader"""
import
os
import
csv
import
sys
import
types
import
numpy
as
np
sys
.
path
.
append
(
"./dgu"
)
import
tokenization
from
batching
import
prepare_batch_data
...
...
@@ -252,6 +254,10 @@ class UDCProcessor(DataProcessor):
examples
=
[]
print
(
"UDC dataset is too big, loading data spent a long time, please wait patiently.................."
)
for
(
i
,
line
)
in
enumerate
(
lines
):
if
len
(
line
)
<
3
:
print
(
"data format error: %s"
%
"
\t
"
.
join
(
line
))
print
(
"data row contains at least three parts: label
\t
conv1
\t
.....
\t
response"
)
continue
guid
=
"%s-%d"
%
(
set_type
,
i
)
text_a
=
"
\t
"
.
join
(
line
[
1
:
-
1
])
text_a
=
tokenization
.
convert_to_unicode
(
text_a
)
...
...
@@ -369,6 +375,10 @@ class ATISSlotProcessor(DataProcessor):
"""Creates examples for the training and dev sets."""
examples
=
[]
for
(
i
,
line
)
in
enumerate
(
lines
):
if
len
(
line
)
!=
2
:
print
(
"data format error: %s"
%
"
\t
"
.
join
(
line
))
print
(
"data row contains two parts: conversation_content
\t
label1 label2 label3"
)
continue
guid
=
"%s-%d"
%
(
set_type
,
i
)
text_a
=
line
[
0
]
label
=
line
[
1
]
...
...
@@ -414,6 +424,10 @@ class ATISIntentProcessor(DataProcessor):
"""Creates examples for the training and dev sets."""
examples
=
[]
for
(
i
,
line
)
in
enumerate
(
lines
):
if
len
(
line
)
!=
2
:
print
(
"data format error: %s"
%
"
\t
"
.
join
(
line
))
print
(
"data row contains two parts: label
\t
conversation_content"
)
continue
guid
=
"%s-%d"
%
(
set_type
,
i
)
text_a
=
line
[
1
]
text_a
=
tokenization
.
convert_to_unicode
(
text_a
)
...
...
@@ -471,6 +485,10 @@ class DSTC2Processor(DataProcessor):
index
=
0
conv_example
=
[]
for
(
i
,
line
)
in
enumerate
(
lines
):
if
len
(
line
)
!=
3
:
print
(
"data format error: %s"
%
"
\t
"
.
join
(
line
))
print
(
"data row contains three parts: conversation_content
\t
question
\1
answer
\t
state1 state2 state3......"
)
continue
conv_no
=
line
[
0
]
text_a
=
line
[
1
]
label_list
=
line
[
2
].
split
()
...
...
@@ -622,6 +640,10 @@ def create_multi_turn_examples(lines, set_type):
conv_example
=
[]
index
=
0
for
(
i
,
line
)
in
enumerate
(
lines
):
if
len
(
line
)
!=
4
:
print
(
"data format error: %s"
%
"
\t
"
.
join
(
line
))
print
(
"data row contains four parts: conversation_id
\t
label
\t
caller
\t
conversation_content"
)
continue
tokens
=
line
conv_no
=
tokens
[
0
]
if
conv_no
!=
conv_id
and
i
!=
0
:
...
...
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/dgu/utils/configure.py
浏览文件 @
3a33a0bb
...
...
@@ -95,8 +95,6 @@ class ArgConfig(object):
)
train_g
.
add_arg
(
"save_steps"
,
int
,
1000
,
"The steps interval to save checkpoints."
)
train_g
.
add_arg
(
"use_fp16"
,
bool
,
False
,
"Whether to use fp16 mixed precision training."
)
train_g
.
add_arg
(
"loss_scaling"
,
float
,
1.0
,
"Loss scaling factor for mixed precision training, only valid when use_fp16 is enabled."
...
...
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/dgu_net.py
浏览文件 @
3a33a0bb
...
...
@@ -46,7 +46,7 @@ def create_net(
sentence_ids
=
sent_ids
,
input_mask
=
input_mask
,
config
=
bert_conf
,
use_fp16
=
args
.
use_fp16
)
use_fp16
=
False
)
params
=
{
'num_labels'
:
num_labels
,
'src_ids'
:
src_ids
,
...
...
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/predict.py
浏览文件 @
3a33a0bb
...
...
@@ -141,6 +141,7 @@ def do_predict(args):
break
np
.
set_printoptions
(
precision
=
4
,
suppress
=
True
)
print
(
"Write the predicted results into the output_prediction_file"
)
with
open
(
args
.
output_prediction_file
,
'w'
)
as
fw
:
if
task_name
not
in
[
'atis_slot'
]:
for
index
,
result
in
enumerate
(
all_results
):
...
...
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/run.sh
浏览文件 @
3a33a0bb
...
...
@@ -23,6 +23,10 @@ OUTPUT_PATH="./data/output"
INFERENCE_MODEL
=
"data/inference_models"
PYTHON_PATH
=
"python"
if
[
-f
${
SAVE_MODEL_PATH
}
]
;
then
rm
${
SAVE_MODEL_PATH
}
fi
if
[
!
-d
${
SAVE_MODEL_PATH
}
]
;
then
mkdir
${
SAVE_MODEL_PATH
}
fi
...
...
@@ -116,8 +120,7 @@ function train()
--learning_rate
=
${
learning_rate
}
\
--weight_decay
=
0.01
\
--max_seq_len
=
${
max_seq_len
}
\
--print_steps
=
${
print_steps
}
\
--use_fp16
false
;
--print_steps
=
${
print_steps
}
;
}
#predicting
...
...
PaddleNLP/dialogue_model_toolkit/dialogue_general_understanding/train.py
浏览文件 @
3a33a0bb
...
...
@@ -140,7 +140,7 @@ def do_train(args):
startup_prog
=
startup_prog
,
weight_decay
=
args
.
weight_decay
,
scheduler
=
args
.
lr_scheduler
,
use_fp16
=
args
.
use_fp16
,
use_fp16
=
False
,
loss_scaling
=
args
.
loss_scaling
)
data_reader
.
decorate_batch_generator
(
batch_generator
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录