README.cn.md 1.7 KB
Newer Older
L
legend06hvl 已提交
1
此目录中代码示例PaddlePaddle所需版本至少为v0.11.0。如果您使用的PaddlePaddle版本早于v0.11.0, [请更新](http://www.paddlepaddle.org/docs/develop/documentation/en/build_and_install/pip_install_en.html).
L
legend06hvl 已提交
2 3 4

---

S
Shan Yi 已提交
5
# 全球标准化阅读器
L
legend06hvl 已提交
6 7 8

该模型实现以下功能:

L
legend06hvl 已提交
9
Jonathan Raiman and John Miller. Globally Normalized Reader. Empirical Methods in Natural Language Processing (EMNLP), 2017
L
legend06hvl 已提交
10 11 12 13 14 15 16 17 18 19 20

如果您在研究中使用数据集/代码,请引用上述论文:

```text
@inproceedings{raiman2015gnr,
    author={Raiman, Jonathan and Miller, John},
    booktitle={Empirical Methods in Natural Language Processing (EMNLP)},
    title={Globally Normalized Reader},
    year={2017},
}
```
S
Shan Yi 已提交
21

L
legend06hvl 已提交
22 23
您也可以访问 https://github.com/baidu-research/GloballyNormalizedReader 以获取更多信息。

S
Shan Yi 已提交
24

L
legend06hvl 已提交
25 26
# 安装

L
legend06hvl 已提交
27
1. 请使用 [docker image](http://doc.paddlepaddle.org/develop/doc/getstarted/build_and_install/docker_install_en.html) 安装最新的PaddlePaddle,运行方法:
S
Shan Yi 已提交
28
    ```bash
L
legend06hvl 已提交
29
    docker pull paddledev/paddle
S
Shan Yi 已提交
30
    ```
L
legend06hvl 已提交
31
2. 下载所有必要的数据,运行方法:
L
legend06hvl 已提交
32 33
    ```bash
    cd data && ./download.sh && cd ..
S
Shan Yi 已提交
34
    ```
L
legend06hvl 已提交
35 36 37 38
3. 预处理并特征化数据:
    ```bash
    python featurize.py --datadir data --outdir data/featurized  --glove-path data/glove.840B.300d.txt
    ```
S
Shan Yi 已提交
39

L
legend06hvl 已提交
40 41 42
# 模型训练

- 根据需要修改config.py来配置模型,然后运行:
S
Shan Yi 已提交
43 44

    ```bash
L
legend06hvl 已提交
45 46 47 48 49 50
    python train.py 2>&1 | tee train.log
    ```

# 使用训练过的模型推断

- 运行以下训练模型来推断:
S
Shan Yi 已提交
51
   ```bash
L
legend06hvl 已提交
52 53 54 55 56 57 58 59
   python infer.py \
     --model_path models/pass_00000.tar.gz \
     --data_dir data/featurized/ \
     --batch_size 2 \
     --use_gpu 0 \
     --trainer_count 1 \
     2>&1 | tee infer.log
   ```