From a288e9def3a171813524fb997e4f2868114db703 Mon Sep 17 00:00:00 2001 From: smallv0221 <33639025+smallv0221@users.noreply.github.com> Date: Fri, 18 Dec 2020 17:45:31 +0800 Subject: [PATCH] mallv0221 fix readme and change cross-entropy api (#5116) * fix readme and change cross-entropy api * change api back --- .../examples/language_model/rnnlm/README.md | 18 ++++++++++++++++-- .../examples/language_model/rnnlm/model.py | 1 - .../DuReader-robust/README.md | 2 +- .../DuReader-yesno/README.md | 2 +- .../SQuAD/README.md | 4 ++-- PaddleNLP/paddlenlp/metrics/squad.py | 4 ++-- 6 files changed, 22 insertions(+), 9 deletions(-) diff --git a/PaddleNLP/examples/language_model/rnnlm/README.md b/PaddleNLP/examples/language_model/rnnlm/README.md index 04fae45b..8ffc4635 100644 --- a/PaddleNLP/examples/language_model/rnnlm/README.md +++ b/PaddleNLP/examples/language_model/rnnlm/README.md @@ -5,8 +5,6 @@ ## 1. 任务说明 本文主要介绍基于lstm的语言的模型的实现,给定一个输入词序列(中文分词、英文tokenize),计算其ppl(语言模型困惑度,用户表示句子的流利程度),基于循环神经网络语言模型的介绍可以[参阅论文](https://arxiv.org/abs/1409.2329)。相对于传统的方法,基于循环神经网络的方法能够更好的解决稀疏词的问题。 -**目前语言模型要求使用PaddlePaddle 2.0及以上版本或适当的develop版本。** - ## 2. 效果说明 @@ -27,6 +25,22 @@ ## 1. 开始第一次模型调用 +### 安装说明 + +* PaddlePaddle 安装 + + 本项目依赖于 PaddlePaddle 2.0-rc1 及以上版本,请参考 [安装指南](http://www.paddlepaddle.org/#quick-start) 进行安装 + +* PaddleNLP 安装 + + ```shell + pip install paddlenlp>=2.0.0b + ``` + +* 环境依赖 + + Python的版本要求 3.6+ + ### 数据准备 为了方便开发者进行测试,我们内置了数据下载脚本,默认自动下载PTB数据集。 diff --git a/PaddleNLP/examples/language_model/rnnlm/model.py b/PaddleNLP/examples/language_model/rnnlm/model.py index b28fc1cb..4cffbcbb 100644 --- a/PaddleNLP/examples/language_model/rnnlm/model.py +++ b/PaddleNLP/examples/language_model/rnnlm/model.py @@ -89,4 +89,3 @@ class UpdateModel(paddle.callbacks.Callback): # This callback reset model hidden states and update learning rate before each epoch begins def on_epoch_begin(self, epoch=None, logs=None): self.model.network.reset_states() - diff --git a/PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/README.md b/PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/README.md index dfad8eb4..f1cfd693 100644 --- a/PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/README.md +++ b/PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/README.md @@ -27,7 +27,7 @@ DuReader-robust数据集是单篇章、抽取式阅读理解数据集,具体 * PaddlePaddle 安装 - 本项目依赖于 PaddlePaddle 2.0 及以上版本,请参考 [安装指南](http://www.paddlepaddle.org/#quick-start) 进行安装 + 本项目依赖于 PaddlePaddle 2.0-rc1 及以上版本,请参考 [安装指南](http://www.paddlepaddle.org/#quick-start) 进行安装 * PaddleNLP 安装 diff --git a/PaddleNLP/examples/machine_reading_comprehension/DuReader-yesno/README.md b/PaddleNLP/examples/machine_reading_comprehension/DuReader-yesno/README.md index 9a970ff6..d1fda2ca 100644 --- a/PaddleNLP/examples/machine_reading_comprehension/DuReader-yesno/README.md +++ b/PaddleNLP/examples/machine_reading_comprehension/DuReader-yesno/README.md @@ -41,7 +41,7 @@ * PaddlePaddle 安装 - 本项目依赖于 PaddlePaddle 2.0 及以上版本,请参考 [安装指南](http://www.paddlepaddle.org/#quick-start) 进行安装 + 本项目依赖于 PaddlePaddle 2.0-rc1 及以上版本,请参考 [安装指南](http://www.paddlepaddle.org/#quick-start) 进行安装 * PaddleNLP 安装 diff --git a/PaddleNLP/examples/machine_reading_comprehension/SQuAD/README.md b/PaddleNLP/examples/machine_reading_comprehension/SQuAD/README.md index 1ba61f9c..21c57482 100644 --- a/PaddleNLP/examples/machine_reading_comprehension/SQuAD/README.md +++ b/PaddleNLP/examples/machine_reading_comprehension/SQuAD/README.md @@ -27,7 +27,7 @@ SQuAD v2.0 * PaddlePaddle 安装 - 本项目依赖于 PaddlePaddle 2.0 及以上版本,请参考 [安装指南](http://www.paddlepaddle.org/#quick-start) 进行安装 + 本项目依赖于 PaddlePaddle 2.0-rc1 及以上版本,请参考 [安装指南](http://www.paddlepaddle.org/#quick-start) 进行安装 * PaddleNLP 安装 @@ -56,7 +56,7 @@ python -u ./run_squad.py \ --batch_size 12 \ --learning_rate 3e-5 \ --num_train_epochs 2 \ - --logging_steps 1000 \ + --logging_steps 100 \ --save_steps 1000 \ --warmup_proportion 0.1 \ --weight_decay 0.01 \ diff --git a/PaddleNLP/paddlenlp/metrics/squad.py b/PaddleNLP/paddlenlp/metrics/squad.py index 23b55b82..da5d11f0 100644 --- a/PaddleNLP/paddlenlp/metrics/squad.py +++ b/PaddleNLP/paddlenlp/metrics/squad.py @@ -378,8 +378,8 @@ def compute_f1(a_gold, a_pred, is_whitespace_splited=True): pred_toks = normalize_answer(a_pred).split() if not is_whitespace_splited: - gold_toks = gold_toks[0] - pred_toks = pred_toks[0] + gold_toks = gold_toks[0] if gold_toks else "" + pred_toks = pred_toks[0] if pred_toks else "" common = collections.Counter(gold_toks) & collections.Counter(pred_toks) num_same = sum(common.values()) -- GitLab