diff --git "a/applications/\351\253\230\347\262\276\345\272\246\344\270\255\346\226\207\350\257\206\345\210\253\346\250\241\345\236\213.md" "b/applications/\351\253\230\347\262\276\345\272\246\344\270\255\346\226\207\350\257\206\345\210\253\346\250\241\345\236\213.md" index 27b63abf3ca8713fe7a40d89b0354a6ec6563deb..31d68abbff3ea17815661c462fd9ab7b1d69a31c 100644 --- "a/applications/\351\253\230\347\262\276\345\272\246\344\270\255\346\226\207\350\257\206\345\210\253\346\250\241\345\236\213.md" +++ "b/applications/\351\253\230\347\262\276\345\272\246\344\270\255\346\226\207\350\257\206\345\210\253\346\250\241\345\236\213.md" @@ -9,7 +9,12 @@ PP-OCRv3是百度开源的超轻量级场景文本检测识别模型库,其中 - UDML:联合互学习策略; - UIM:无标注数据挖掘方案。 -其中 *UIM:无标注数据挖掘方案* 使用了高精度的SVTR中文模型,该模型在PP-OCRv3识别的数据集上训练,精度为82.5%。本项目主要介绍SVTR中文模型如何使用。 +其中 *UIM:无标注数据挖掘方案* 使用了高精度的SVTR中文模型进行无标注文件的刷库,该模型在PP-OCRv3识别的数据集上训练,精度对比如下表。 + +|中文识别算法|模型|精度| +| --- | --- | --- | +|PP-OCRv3|SVTR_LCNet|79.4%| +|SVTR|SVTR-Tiny|82.5%| aistudio项目链接: [高精度中文场景文本识别模型SVTR](https://aistudio.baidu.com/aistudio/projectdetail/4263032) @@ -96,6 +101,6 @@ python3 tools/infer/predict_rec.py --image_dir="./doc/imgs_words/ch/word_1.jpg" **注意** -- 使用PP-OCRv3识别SVTR_LCNet进行推理时,不需要使用--rec_algorithm指定算法名称,使用默认的推理方式即为PP-OCRv3识别的推理过程。但是使用SVTR算法时,需要指定--rec_algorithm='SVTR' +- 使用SVTR算法时,需要指定--rec_algorithm='SVTR' - 如果使用自定义字典训练的模型,需要将--rec_char_dict_path=ppocr/utils/ppocr_keys_v1.txt修改为自定义的字典 - --rec_image_shape='3, 32, 320' 该参数不能去掉