README.md 1.5 KB
Newer Older
S
Steffy-zxf 已提交
1
# LAC 词法分析
W
wuzewu 已提交
2

3 4 5

本示例展示如何使用LAC Module进行预测。

S
Steffy-zxf 已提交
6
LAC是中文词法分析模型,可以用于进行中文句子的分词/词性标注/命名实体识别等功能,关于模型的细节参见[模型介绍](https://www.paddlepaddle.org.cn/hubdetail?name=lac&en_category=LexicalAnalysis)
7 8


S
Steffy-zxf 已提交
9 10 11 12
## 命令行方式预测

`cli_demo.sh`给出了使用命令行接口(Command Line Interface)调用Module预测的示例脚本
通过以下命令试验下效果
13

W
wuzewu 已提交
14
```shell
S
Steffy-zxf 已提交
15 16
$ hub run lac --input_text "今天是个好日子"
$ hub run lac --input_file test.txt --user_dict user.dict
W
wuzewu 已提交
17
```
S
Steffy-zxf 已提交
18
test.txt 存放待分词文本, 如:
W
wuzewu 已提交
19

S
Steffy-zxf 已提交
20 21 22
```text
今天是个好日子     
今天天气晴朗
23
```
S
Steffy-zxf 已提交
24 25
user.dict为用户自定义词典,可以不指定,当指定自定义词典时,可以干预默认分词结果。
词典包含三列,第一列为单词,第二列为单词词性,第三列为单词词频,以水平制表符\t分隔。词频越高的单词,对分词结果影响越大,词典样例如下:
26

S
Steffy-zxf 已提交
27 28 29 30 31
```text
天气预报        n       400000        
经      v       1000        
常      d       1000          
```
32

S
Steffy-zxf 已提交
33
**NOTE:**
34

S
Steffy-zxf 已提交
35 36
* 该PaddleHub Module使用词典干预功能时,依赖于第三方库pyahocorasick,请自行安装
* 请不要直接复制示例文本使用,复制后的格式可能存在问题
37 38


Z
Zeyu Chen 已提交
39
## 通过Python API预测
40

Z
Zeyu Chen 已提交
41
`lac_demo.py`给出了使用python API调用PaddleHub LAC Module预测的示例代码
W
wuzewu 已提交
42
通过以下命令试验下效果
43

W
wuzewu 已提交
44
```shell
Z
Zeyu Chen 已提交
45
python lac_demo.py
W
wuzewu 已提交
46
```