Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
9b1e8272
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
9b1e8272
编写于
4月 29, 2022
作者:
T
Topdu
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
modify nrtr and svtr docs
上级
514de3d5
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
54 addition
and
7 deletion
+54
-7
doc/doc_ch/algorithm_rec_nrtr.md
doc/doc_ch/algorithm_rec_nrtr.md
+29
-4
doc/doc_ch/algorithm_rec_svtr.md
doc/doc_ch/algorithm_rec_svtr.md
+25
-3
未找到文件。
doc/doc_ch/algorithm_rec_nrtr.md
浏览文件 @
9b1e8272
...
@@ -25,10 +25,9 @@
...
@@ -25,10 +25,9 @@
<a
name=
"model"
></a>
<a
name=
"model"
></a>
`NRTR`
使用MJSynth和SynthText两个文字识别数据集训练,在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上进行评估,算法复现效果如下:
`NRTR`
使用MJSynth和SynthText两个文字识别数据集训练,在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上进行评估,算法复现效果如下:
| | Avg accruacy | 下载链接 | 配置文件 |
|模型|骨干网络|配置文件|Acc|下载链接|
|--------|------------|--------------------------------------------------------------------------------| --- |
| --- | --- | --- | --- | --- |
| NRTR | 84.21% |
[
训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/rec_mtb_nrtr_train.tar
)
|
[
config
](
../../configs/rec/rec_mtb_nrtr.yml
)
|
|NRTR|MTB|
[
rec_mtb_nrtr.yml
](
../../configs/rec/rec_mtb_nrtr.yml
)
|84.21%|
[
训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/rec_mtb_nrtr_train.tar
)
|
<a
name=
"2"
></a>
<a
name=
"2"
></a>
## 2. 环境配置
## 2. 环境配置
...
@@ -87,6 +86,17 @@ python3 tools/infer_rec.py -c configs/rec/rec_mtb_nrtr.yml -o Global.infer_img='
...
@@ -87,6 +86,17 @@ python3 tools/infer_rec.py -c configs/rec/rec_mtb_nrtr.yml -o Global.infer_img='
# 注意将pretrained_model的路径设置为本地路径。
# 注意将pretrained_model的路径设置为本地路径。
python3 tools/export_model.py
-c
configs/rec/rec_mtb_nrtr.yml
-o
Global.pretrained_model
=
./rec_mtb_nrtr_train/best_accuracy Global.save_inference_dir
=
./inference/rec_mtb_nrtr/
python3 tools/export_model.py
-c
configs/rec/rec_mtb_nrtr.yml
-o
Global.pretrained_model
=
./rec_mtb_nrtr_train/best_accuracy Global.save_inference_dir
=
./inference/rec_mtb_nrtr/
```
```
**注意:**
-
如果您是在自己的数据集上训练的模型,并且调整了字典文件,请注意修改配置文件中的
`character_dict_path`
是否是所需要的字典文件。
-
如果您修改了训练时的输入大小,请修改
`tools/export_model.py`
文件中的对应NRTR的
`infer_shape`
。
转换成功后,在目录下有三个文件:
```
/inference/rec_mtb_nrtr/
├── inference.pdiparams # 识别inference模型的参数文件
├── inference.pdiparams.info # 识别inference模型的参数信息,可忽略
└── inference.pdmodel # 识别inference模型的program文件
```
执行如下命令进行模型推理:
执行如下命令进行模型推理:
...
@@ -95,6 +105,21 @@ python3 tools/infer/predict_rec.py --image_dir='./doc/imgs_words_en/word_10.png'
...
@@ -95,6 +105,21 @@ python3 tools/infer/predict_rec.py --image_dir='./doc/imgs_words_en/word_10.png'
# 预测文件夹下所有图像时,可修改image_dir为文件夹,如 --image_dir='./doc/imgs_words_en/'。
# 预测文件夹下所有图像时,可修改image_dir为文件夹,如 --image_dir='./doc/imgs_words_en/'。
```
```
![](
../imgs_words_en/word_10.png
)
执行命令后,上面图像的预测结果(识别的文本和得分)会打印到屏幕上,示例如下:
结果如下:
```
shell
Predicts of ./doc/imgs_words_en/word_10.png:
(
'pain'
, 0.9265879392623901
)
```
**注意**
:
-
训练上述模型采用的图像分辨率是[1,32,100],需要通过参数
`rec_image_shape`
设置为您训练时的识别图像形状。
-
在推理时需要设置参数
`rec_char_dict_path`
指定字典,如果您修改了字典,请修改该参数为您的字典文件。
-
如果您修改了预处理方法,需修改
`tools/infer/predict_rec.py`
中NRTR的预处理为您的预处理方法。
<a
name=
"4-2"
></a>
<a
name=
"4-2"
></a>
### 4.2 C++推理部署
### 4.2 C++推理部署
...
...
doc/doc_ch/algorithm_rec_svtr.md
浏览文件 @
9b1e8272
...
@@ -36,7 +36,7 @@ SVTR在场景文本识别公开数据集上的精度(%)和模型文件如下:
...
@@ -36,7 +36,7 @@ SVTR在场景文本识别公开数据集上的精度(%)和模型文件如下:
*
中文数据集来自于
[
Chinese Benckmark
](
https://arxiv.org/abs/2112.15093
)
,SVTR的中文训练评估策略遵循该论文。
*
中文数据集来自于
[
Chinese Benckmark
](
https://arxiv.org/abs/2112.15093
)
,SVTR的中文训练评估策略遵循该论文。
|
|IC13
<br/>
857 | SVT |IIIT5k
<br/>
3000 |IC15
<br/>
1811| SVTP |CUTE80 | Avg_6 |IC15
<br/>
2077 |IC13
<br/>
1015 |IC03
<br/>
867|IC03
<br/>
860|Avg_10 | Chinese
<br/>
scene_test| 下载链接 |
|
模型
|IC13
<br/>
857 | SVT |IIIT5k
<br/>
3000 |IC15
<br/>
1811| SVTP |CUTE80 | Avg_6 |IC15
<br/>
2077 |IC13
<br/>
1015 |IC03
<br/>
867|IC03
<br/>
860|Avg_10 | Chinese
<br/>
scene_test| 下载链接 |
|:----------:|:------:|:-----:|:---------:|:------:|:-----:|:-----:|:-----:|:-------:|:-------:|:-----:|:-----:|:---------------------------------------------:|:-----:|:-----:|
|:----------:|:------:|:-----:|:---------:|:------:|:-----:|:-----:|:-----:|:-------:|:-------:|:-----:|:-----:|:---------------------------------------------:|:-----:|:-----:|
| SVTR Tiny | 96.85 | 91.34 | 94.53 | 83.99 | 85.43 | 89.24 | 90.87 | 80.55 | 95.37 | 95.27 | 95.70 | 90.13 | 67.90 |
[
英文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_tiny_none_ctc_en_train.tar
)
/
[
中文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_tiny_none_ctc_ch_train.tar
)
|
| SVTR Tiny | 96.85 | 91.34 | 94.53 | 83.99 | 85.43 | 89.24 | 90.87 | 80.55 | 95.37 | 95.27 | 95.70 | 90.13 | 67.90 |
[
英文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_tiny_none_ctc_en_train.tar
)
/
[
中文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_tiny_none_ctc_ch_train.tar
)
|
| SVTR Small | 95.92 | 93.04 | 95.03 | 84.70 | 87.91 | 92.01 | 91.63 | 82.72 | 94.88 | 96.08 | 96.28 | 91.02 | 69.00 |
[
英文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_small_none_ctc_en_train.tar
)
/
[
中文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_small_none_ctc_ch_train.tar
)
|
| SVTR Small | 95.92 | 93.04 | 95.03 | 84.70 | 87.91 | 92.01 | 91.63 | 82.72 | 94.88 | 96.08 | 96.28 | 91.02 | 69.00 |
[
英文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_small_none_ctc_en_train.tar
)
/
[
中文
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_small_none_ctc_ch_train.tar
)
|
...
@@ -77,7 +77,7 @@ python3 -m paddle.distributed.launch --gpus '0,1,2,3' tools/train.py -c configs
...
@@ -77,7 +77,7 @@ python3 -m paddle.distributed.launch --gpus '0,1,2,3' tools/train.py -c configs
<a
name=
"3-2"
></a>
<a
name=
"3-2"
></a>
### 3.2 评估
### 3.2 评估
可下载
`SVTR`
提供模型文件和配置文件:
[
下载地址
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_tiny_none_ctc_en_train.tar
)
,以
`SVTR-T`
为例,使用如下命令进行评估:
可下载
`SVTR`
提供
的
模型文件和配置文件:
[
下载地址
](
https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/rec_svtr_tiny_none_ctc_en_train.tar
)
,以
`SVTR-T`
为例,使用如下命令进行评估:
```
shell
```
shell
# 注意将pretrained_model的路径设置为本地路径。
# 注意将pretrained_model的路径设置为本地路径。
...
@@ -107,17 +107,39 @@ python3 tools/infer_rec.py -c ./rec_svtr_tiny_en_train/rec_svtr_tiny_6local_6glo
...
@@ -107,17 +107,39 @@ python3 tools/infer_rec.py -c ./rec_svtr_tiny_en_train/rec_svtr_tiny_6local_6glo
python3 tools/export_model.py
-c
./rec_svtr_tiny_en_train/rec_svtr_tiny_6local_6global_stn_en.yml
-o
Global.pretrained_model
=
./rec_svtr_tiny_none_ctc_en_train/best_accuracy Global.save_inference_dir
=
./inference/rec_svtr_tiny_stn_en
python3 tools/export_model.py
-c
./rec_svtr_tiny_en_train/rec_svtr_tiny_6local_6global_stn_en.yml
-o
Global.pretrained_model
=
./rec_svtr_tiny_none_ctc_en_train/best_accuracy Global.save_inference_dir
=
./inference/rec_svtr_tiny_stn_en
```
```
**注意:**
-
如果您是在自己的数据集上训练的模型,并且调整了字典文件,请注意修改配置文件中的
`character_dict_path`
是否为所正确的字典文件。
-
如果您修改了训练时的输入大小,请修改
`tools/export_model.py`
文件中的对应SVTR的
`infer_shape`
。
转换成功后,在目录下有三个文件:
```
/inference/rec_svtr_tiny_stn_en/
├── inference.pdiparams # 识别inference模型的参数文件
├── inference.pdiparams.info # 识别inference模型的参数信息,可忽略
└── inference.pdmodel # 识别inference模型的program文件
```
执行如下命令进行模型推理:
执行如下命令进行模型推理:
```
shell
```
shell
python3 tools/infer/predict_rec.py
--image_dir
=
'./doc/imgs_words_en/word_10.png'
--rec_model_dir
=
'./inference/rec_svtr_tiny_stn_en/'
--rec_algorithm
=
'SVTR'
--rec_image_shape
=
'3,64,256'
--rec_char_dict_path
=
'./ppocr/utils/ic15_dict.txt'
python3 tools/infer/predict_rec.py
--image_dir
=
'./doc/imgs_words_en/word_10.png'
--rec_model_dir
=
'./inference/rec_svtr_tiny_stn_en/'
--rec_algorithm
=
'SVTR'
--rec_image_shape
=
'3,64,256'
--rec_char_dict_path
=
'./ppocr/utils/ic15_dict.txt'
# 预测文件夹下所有图像时,可修改image_dir为文件夹,如 --image_dir='./doc/imgs_words_en/'。
# 预测文件夹下所有图像时,可修改image_dir为文件夹,如 --image_dir='./doc/imgs_words_en/'。
```
```
![](
../imgs_words_en/word_10.png
)
执行命令后,上面图像的预测结果(识别的文本和得分)会打印到屏幕上,示例如下:
结果如下:
结果如下:
```
shell
```
shell
[
2022/04/26 10:11:01] ppocr INFO:
Predicts of ./doc/imgs_words_en/word_10.png:
(
'pain'
, 0.9999998807907104
)
Predicts of ./doc/imgs_words_en/word_10.png:
(
'pain'
, 0.9999998807907104
)
```
```
**注意**
:
-
如果您调整了训练时的输入分辨率,需要通过参数
`rec_image_shape`
设置为您需要的识别图像形状。
-
在推理时需要设置参数
`rec_char_dict_path`
指定字典,如果您修改了字典,请修改该参数为您的字典文件。
-
如果您修改了预处理方法,需修改
`tools/infer/predict_rec.py`
中SVTR的预处理为您的预处理方法。
<a
name=
"4-2"
></a>
<a
name=
"4-2"
></a>
### 4.2 C++推理部署
### 4.2 C++推理部署
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录