fix lac small bugs in README and run.sh (#4213)

c98dbafd · Xing Wu · Guo Sheng · e6436070 · c98dbafd · c98dbafd
隐藏空白更改
内联并排

Showing with 5 addition and 4 deletion

dygraph/lac/README.md dygraph/lac/README.md +2 -2

dygraph/lac/run.sh dygraph/lac/run.sh +3 -2

未找到文件。
--- a/dygraph/lac/README.md
+++ b/dygraph/lac/README.md
@@ -23,7 +23,7 @@ Lexical Analysis of Chinese，简称 LAC，是一个联合的词法分析模型
 克隆工具集代码库到本地
 ```bash
 git clone https://github.com/PaddlePaddle/models.git
- cd https://github.com/PaddlePaddle/models/tree/develop/dygraph/lac
+ cd models/dygraph/lac
 ```

 #### 3. 环境依赖
@@ -88,7 +88,7 @@ sh predict.sh
 上面介绍的模型原理如下图所示：<br />


-![GRU-CRF-MODEL](./gru-crf-model.png)
+![GRU-CRF-MODEL](https://github.com/PaddlePaddle/models/blob/develop/PaddleNLP/lexical_analysis/gru-crf-model.png)

 ### 数据格式
 训练使用的数据可以由用户根据实际的应用场景，自己组织数据。除了第一行是 `text_a\tlabel` 固定的开头，后面的每行数据都是由两列组成，以制表符分隔，第一列是 utf-8 编码的中文文本，以 `\002` 分割，第二列是对应每个字的标注，以 `\002` 分隔。我们采用 IOB2 标注体系，即以 X-B 作为类型为 X 的词的开始，以 X-I 作为类型为 X 的词的持续，以 O 表示不关注的字（实际上，在词性、专名联合标注中，不存在 O ）。示例如下：

--- a/dygraph/lac/run.sh
+++ b/dygraph/lac/run.sh
@@ -2,8 +2,9 @@
 export FLAGS_fraction_of_gpu_memory_to_use=0.02
 export FLAGS_eager_delete_tensor_gb=0.0
 export FLAGS_fast_eager_deletion_mode=1
+export CUDA_VISIBLE_DEVICES=0,1,2,3

-python -m paddle.distributed.launch --selected_gpus=3,4,6,7 train.py \
+python -m paddle.distributed.launch --selected_gpus=0,1,2,3 train.py \
        --train_data ./data/train.tsv \
        --test_data ./data/test.tsv \
        --model_save_dir ./padding_models \
@@ -25,4 +26,4 @@ python -m paddle.distributed.launch --selected_gpus=3,4,6,7 train.py \
        --enable_ce false \
        --use_cuda true \
        --cpu_num 1 \
-        --use_data_paralle True
\ No newline at end of file
+        --use_data_paralle True