From 4c5f595c18d48cb1f44613541dd546b9475312a8 Mon Sep 17 00:00:00 2001 From: JesseyXujin <516770320@qq.com> Date: Mon, 8 Apr 2019 15:17:56 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E6=94=B9?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- PaddleNLP/ELMO/README.md | 3 ++- 1 file changed, 2 insertions(+), 1 deletion(-) diff --git a/PaddleNLP/ELMO/README.md b/PaddleNLP/ELMO/README.md index 406230fc..50585873 100755 --- a/PaddleNLP/ELMO/README.md +++ b/PaddleNLP/ELMO/README.md @@ -20,7 +20,8 @@ glob ## 预训练模型 -1. 把文档文件切分成句子,并基于词表(参考vocabulary_min5k.txt)对句子进行切词。把文件切分成训练集trainset和测试集testset。 +1. 把文档文件切分成句子,并基于词表(参考vocabulary_min5k.txt)对句子进行切词。把文件切分成训练集trainset和测试集testset。训练数据参考data/train,测试数据参考data/dev, +训练集和测试集比例推荐为5:1。 ``` 本 书 介绍 了 中国 经济 发展 的 内外 平衡 问题 、 亚洲 金融 危机 十 周年 回顾 与 反思 、 实践 中 的 城乡 统筹 发展 、 未来 十 年 中国 需要 研究 的 重大 课题 、 科学 发展 与 新型 工业 化 等 方面 。 -- GitLab