未验证 提交 da2f12b4 编写于 作者: L lilu 提交者: GitHub

test=develop (#2245)

上级 1e469e11
...@@ -20,7 +20,7 @@ Overview of Deep Attention Matching Network ...@@ -20,7 +20,7 @@ Overview of Deep Attention Matching Network
### 安装说明 ### 安装说明
1. paddle安装 1. paddle安装
本项目依赖于Paddle Fluid 1.3.1 及以上版本,请参考[安装指南](http://www.paddlepaddle.org/#quick-start)进行安装 本项目依赖于Paddle Fluid 1.3.1 及以上版本,请参考[安装指南](http://www.paddlepaddle.org/#quick-start)进行安装
2. 安装代码 2. 安装代码
...@@ -37,35 +37,35 @@ Overview of Deep Attention Matching Network ...@@ -37,35 +37,35 @@ Overview of Deep Attention Matching Network
### 开始第一次模型调用 ### 开始第一次模型调用
1. 数据准备 1. 数据准备
下载经过预处理的数据,运行该脚本之后,data目录下会存在ubuntu和douban两个文件夹。 下载经过预处理的数据,运行该脚本之后,data目录下会存在ubuntu和douban两个文件夹。
``` ```
cd data cd data
sh download_data.sh sh download_data.sh
``` ```
2. 模型训练 2. 模型训练
``` ```
python -u main.py \ python -u main.py \
--do_train True \ --do_train True \
--use_cuda \ --use_cuda \
--data_path ./data/ubuntu/data_small.pkl \ --data_path ./data/ubuntu/data_small.pkl \
--save_path ./model_files/ubuntu \ --save_path ./model_files/ubuntu \
--use_pyreader \ --use_pyreader \
--vocab_size 434512 \ --vocab_size 434512 \
--_EOS_ 28270 \ --_EOS_ 28270 \
--batch_size 32 --batch_size 32
``` ```
3. 模型评估 3. 模型评估
``` ```
python -u main.py \ python -u main.py \
--do_test True \ --do_test True \
--use_cuda \ --use_cuda \
--data_path ./data/ubuntu/data_small.pkl \ --data_path ./data/ubuntu/data_small.pkl \
--save_path ./model_files/ubuntu/step_372 \ --save_path ./model_files/ubuntu/step_372 \
--model_path ./model_files/ubuntu/step_372 \ --model_path ./model_files/ubuntu/step_372 \
--vocab_size 434512 \ --vocab_size 434512 \
--_EOS_ 28270 \ --_EOS_ 28270 \
--batch_size 100 --batch_size 100
``` ```
## 进阶使用 ## 进阶使用
### 任务定义与建模 ### 任务定义与建模
多轮对话匹配任务输入是多轮对话历史和候选回复,输出是回复匹配得分,根据匹配得分排序。 多轮对话匹配任务输入是多轮对话历史和候选回复,输出是回复匹配得分,根据匹配得分排序。
...@@ -74,6 +74,10 @@ Overview of Deep Attention Matching Network ...@@ -74,6 +74,10 @@ Overview of Deep Attention Matching Network
### 数据格式说明 ### 数据格式说明
训练、预测、评估使用的数据示例如下,数据由三列组成,以制表符('\t')分隔,第一列是以空 训练、预测、评估使用的数据示例如下,数据由三列组成,以制表符('\t')分隔,第一列是以空
格分开的上文id,第二列是以空格分开的回复id,第三列是标签 格分开的上文id,第二列是以空格分开的回复id,第三列是标签
```
286 642 865 36 87 25 693 0
17 54 975 512 775 54 6 1
```
注:本项目额外提供了分词预处理脚本(在preprocess目录下),可供用户使用,具体使用方法如 注:本项目额外提供了分词预处理脚本(在preprocess目录下),可供用户使用,具体使用方法如
下: 下:
...@@ -97,4 +101,3 @@ run.sh:训练、预测运行脚本 ...@@ -97,4 +101,3 @@ run.sh:训练、预测运行脚本
如何贡献代码 如何贡献代码
如果你可以修复某个issue或者增加一个新功能,欢迎给我们提交PR。如果对应的PR被接受了,我们将根据贡献的质量和难度进行打分(0-5分,越高越好)。如果你累计获得了10分,可以联系我们获得面试机会或者为你写推荐信。 如果你可以修复某个issue或者增加一个新功能,欢迎给我们提交PR。如果对应的PR被接受了,我们将根据贡献的质量和难度进行打分(0-5分,越高越好)。如果你累计获得了10分,可以联系我们获得面试机会或者为你写推荐信。
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册