diff --git a/fluid/chinese_ner/README.md b/fluid/chinese_ner/README.md index 11ad805f9108827002acadbf87da58b678fab4d6..de9aa9b798d2dccbd0c9353d636cac810ee9ed0b 100644 --- a/fluid/chinese_ner/README.md +++ b/fluid/chinese_ner/README.md @@ -1,22 +1,22 @@ -#使用ParallelExecutor的中文命名实体识别示例 +# 浣跨敤ParallelExecutor鐨勪腑鏂囧懡鍚嶅疄浣撹瘑鍒ず渚 -以下是本例的简要目录结构及说明: +浠ヤ笅鏄湰渚嬬殑绠瑕佺洰褰曠粨鏋勫強璇存槑锛 ```text . -├── data # 存储运行本例所依赖的数据,从外部获取 -├── reader.py # 数据读取接口, 从外部获取 -├── README.md # 文档 -├── train.py # 训练脚本 -├── infer.py # 预测脚本 +鈹溾攢鈹 data # 瀛樺偍杩愯鏈緥鎵渚濊禆鐨勬暟鎹紝浠庡閮ㄨ幏鍙 +鈹溾攢鈹 reader.py # 鏁版嵁璇诲彇鎺ュ彛, 浠庡閮ㄨ幏鍙 +鈹溾攢鈹 README.md # 鏂囨。 +鈹溾攢鈹 train.py # 璁粌鑴氭湰 +鈹溾攢鈹 infer.py # 棰勬祴鑴氭湰 ``` -##数据 -在data目录下,有两个文件夹,train_files中保存的是训练数据,test_files中保存的是测试数据,作为示例,在目录下我们各放置了两个文件,实际训练时,根据自己的实际需要将数据放置在对应目录,并根据数据格式,修改reader.py中的数据读取函数。 +## 鏁版嵁 +鍦╠ata鐩綍涓嬶紝鏈変袱涓枃浠跺す锛宼rain_files涓繚瀛樼殑鏄缁冩暟鎹紝test_files涓繚瀛樼殑鏄祴璇曟暟鎹紝浣滀负绀轰緥锛屽湪鐩綍涓嬫垜浠悇鏀剧疆浜嗕袱涓枃浠讹紝瀹為檯璁粌鏃讹紝鏍规嵁鑷繁鐨勫疄闄呴渶瑕佸皢鏁版嵁鏀剧疆鍦ㄥ搴旂洰褰曪紝骞舵牴鎹暟鎹牸寮忥紝淇敼reader.py涓殑鏁版嵁璇诲彇鍑芥暟銆 -#训练 -修改train.py` 的 `main` 函数,指定数据路径,运行`python train.py`开始训练 -训练记录形如 +## 璁粌 +淇敼顡rain.py` 鐨 `main` 鍑芥暟锛屾寚瀹氭暟鎹矾寰勶紝杩愯`python train.py`寮濮嬭缁 +璁粌璁板綍褰㈠ ```txt pass_id:0, time_cost:4.92960214615s [Train] precision:0.000862136531076, recall:0.0059880239521, f1:0.00150726226363 @@ -29,9 +29,9 @@ pass_id:2, time_cost:0.740842103958s [Test] precision:0, recall:0.0, f1:0 ``` -#预测 -修改 [infer.py](./infer.py) 的 `infer` 函数,指定:需要测试的模型的路径、测试数据、字典文件,预测标记文件的路径,运行`python infer.py`开始预测 -预测结果如下 +## 棰勬祴 +淇敼 [infer.py](./infer.py) 鐨 `infer` 鍑芥暟锛屾寚瀹氾細闇瑕佹祴璇曠殑妯″瀷鐨勮矾寰勩佹祴璇曟暟鎹佸瓧鍏告枃浠讹紝棰勬祴鏍囪鏂囦欢鐨勮矾寰勶紝杩愯`python infer.py`寮濮嬮娴 +棰勬祴缁撴灉濡備笅 ```txt 152804 O O 130048 O O @@ -50,4 +50,4 @@ pass_id:2, time_cost:0.740842103958s 247 24-B O 401 24-I O ``` -输出分为三列,以"\t"分割,第一列是输入的词语的序号,第二列是标准结果,第三列为标记结果。多条输入序列之间以空行分隔。 +杈撳嚭鍒嗕负涓夊垪锛屼互"\t"鍒嗗壊锛岀涓鍒楁槸杈撳叆鐨勮瘝璇殑搴忓彿锛岀浜屽垪鏄爣鍑嗙粨鏋滐紝绗笁鍒椾负鏍囪缁撴灉銆傚鏉¤緭鍏ュ簭鍒椾箣闂翠互绌鸿鍒嗛殧銆