“57f2667cc7ebf69bd5fdb26f132228d331766ea8”上不存在“README.md”
未验证 提交 cba0350c 编写于 作者: S smallv0221 提交者: GitHub

fix dureader-robust readme (#5078)

* fix bleu bug

* fix bleu bug

* fix doc example

* minor fix

* fix squad dataset bug

* fix readme
上级 cd6b89a0
...@@ -17,7 +17,7 @@ DuReaderrobust数据集是单篇章、抽取式阅读理解数据集,具体的 ...@@ -17,7 +17,7 @@ DuReaderrobust数据集是单篇章、抽取式阅读理解数据集,具体的
**篇章 p**: 迈克尔.乔丹在NBA打了15个赛季。他在84年进入nba,期间在1993年10月6日第一次退役改打棒球,95年3月18日重新回归,在99年1月13日第二次退役,后于2001年10月31日复出,在03年最终退役… **篇章 p**: 迈克尔.乔丹在NBA打了15个赛季。他在84年进入nba,期间在1993年10月6日第一次退役改打棒球,95年3月18日重新回归,在99年1月13日第二次退役,后于2001年10月31日复出,在03年最终退役…
**参考答案 (a)**: [‘15个’,‘15个赛季’] **参考答案 a**: [‘15个’,‘15个赛季’]
关于该数据集的详细内容,可参考数据集[论文](https://arxiv.org/abs/2004.11142) 关于该数据集的详细内容,可参考数据集[论文](https://arxiv.org/abs/2004.11142)
...@@ -36,6 +36,7 @@ DuReaderrobust数据集是单篇章、抽取式阅读理解数据集,具体的 ...@@ -36,6 +36,7 @@ DuReaderrobust数据集是单篇章、抽取式阅读理解数据集,具体的
```shell ```shell
python -u ./run_du.py \ python -u ./run_du.py \
--task_name dureader-robust \
--model_type bert \ --model_type bert \
--model_name_or_path bert-base-chinese \ --model_name_or_path bert-base-chinese \
--max_seq_length 384 \ --max_seq_length 384 \
...@@ -50,6 +51,7 @@ python -u ./run_du.py \ ...@@ -50,6 +51,7 @@ python -u ./run_du.py \
--n_gpu 1 \ --n_gpu 1 \
``` ```
* `task_name`: 数据集的名称,不区分大小写,如dureader-robust,cmrc等。
* `model_type`: 预训练模型的种类。如bert,ernie,roberta等。 * `model_type`: 预训练模型的种类。如bert,ernie,roberta等。
* `model_name_or_path`: 预训练模型的具体名称。如bert-base-uncased,bert-large-cased等。或者是模型文件的本地路径。 * `model_name_or_path`: 预训练模型的具体名称。如bert-base-uncased,bert-large-cased等。或者是模型文件的本地路径。
* `output_dir`: 保存模型checkpoint的路径。 * `output_dir`: 保存模型checkpoint的路径。
......
...@@ -434,7 +434,7 @@ class SQuAD(Dataset): ...@@ -434,7 +434,7 @@ class SQuAD(Dataset):
is_impossible=is_impossible) is_impossible=is_impossible)
examples.append(example) examples.append(example)
self.examples = examples[:1000] self.examples = examples
def __len__(self): def __len__(self):
return len(self.features) return len(self.features)
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册