diff --git a/README_ch.md b/README_ch.md index 997d48a778bf4a1d1b38d1ee59269f0bd7f6d1b1..ba2f0305838144ea327219aa1af73aa45f486779 100755 --- a/README_ch.md +++ b/README_ch.md @@ -28,6 +28,8 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力 ## 特性 +支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程。 + ![](./doc/features.png) > 上述内容的使用方法建议从文档教程中的快速开始体验 diff --git a/doc/doc_ch/algorithm_inference.md b/doc/doc_ch/algorithm_inference.md index ade1a2dbdf728ac785efef3e5a82b4c932674b87..0222dec85a0be0973b2546cbb6e5347852242093 100755 --- a/doc/doc_ch/algorithm_inference.md +++ b/doc/doc_ch/algorithm_inference.md @@ -14,12 +14,14 @@ inference 模型(`paddle.jit.save`保存的模型) - [识别模型转inference模型](#识别模型转inference模型) - [方向分类模型转inference模型](#方向分类模型转inference模型) + - [二、文本检测模型推理](#文本检测模型推理) - [1. 超轻量中文检测模型推理](#超轻量中文检测模型推理) - [2. DB文本检测模型推理](#DB文本检测模型推理) - [3. EAST文本检测模型推理](#EAST文本检测模型推理) - [4. SAST文本检测模型推理](#SAST文本检测模型推理) + - [三、文本识别模型推理](#文本识别模型推理) - [1. 超轻量中文识别模型推理](#超轻量中文识别模型推理) - [2. 基于CTC损失的识别模型推理](#基于CTC损失的识别模型推理) @@ -27,15 +29,19 @@ inference 模型(`paddle.jit.save`保存的模型) - [4. 自定义文本识别字典的推理](#自定义文本识别字典的推理) - [5. 多语言模型的推理](#多语言模型的推理) + - [四、方向分类模型推理](#方向识别模型推理) - [1. 方向分类模型推理](#方向分类模型推理) + - [五、文本检测、方向分类和文字识别串联推理](#文本检测、方向分类和文字识别串联推理) - [1. 超轻量中文OCR模型推理](#超轻量中文OCR模型推理) - [2. 其他模型推理](#其他模型推理) + - [六、参数解释](#参数解释) + - [七、FAQ](#FAQ) diff --git a/doc/doc_ch/algorithm_overview.md b/doc/doc_ch/algorithm_overview.md index bfcf951a7c7a4da75460abe8f14f27c4ad5cc4c3..e595bb6ce61e1f2c9158899447d5fa2deac8e8b5 100755 --- a/doc/doc_ch/algorithm_overview.md +++ b/doc/doc_ch/algorithm_overview.md @@ -1,16 +1,16 @@ # OCR算法 -- [1. 算法介绍](#1-算法介绍) +- [1. 两阶段算法](#1-两阶段算法) - [1.1 文本检测算法](#11-文本检测算法) - [1.2 文本识别算法](#12-文本识别算法) - - [1.3 端到端算法](#13-端到端算法) -- [2. 模型训练](#2-模型训练) -- [3. 模型推理](#3-模型推理) +- [2. 端到端算法](#2-端到端算法) + + +本文给出了PaddleOCR已支持的OCR算法列表,以及每个算法在**英文公开数据集**上的模型和指标,主要用于算法简介和算法性能对比,更多包括中文在内的其他数据集上的模型请参考[PP-OCR v2.0 系列模型下载](./models_list.md)。 -## 1. 算法介绍 -本文给出了PaddleOCR已支持的文本检测算法和文本识别算法列表,以及每个算法在**英文公开数据集**上的模型和指标,主要用于算法简介和算法性能对比,更多包括中文在内的其他数据集上的模型请参考[PP-OCR v2.0 系列模型下载](./models_list.md)。 +## 1. 两阶段算法 @@ -50,6 +50,13 @@ PaddleOCR开源的文本检测算法列表: * [百度云地址](https://pan.baidu.com/s/12cPnZcVuV1zn5DOd4mqjVw) (提取码: 2bpi) * [Google Drive下载地址](https://drive.google.com/drive/folders/1ll2-XEVyCQLpJjawLDiRlvo_i4BqHCJe?usp=sharing) + +**模型训练与推理** + +- 以上文本检测算法的训练请参考文档教程中[模型训练/评估中的文本检测部分](./detection.md)。 +- 上述模型中除PP-OCR系列模型以外,其余模型仅支持基于Python引擎的推理,具体内容可参考[基于Python预测引擎推理](./algorithm_inference.md) + + ### 1.2 文本识别算法 @@ -81,23 +88,21 @@ PaddleOCR开源的文本识别算法列表: |SAR|Resnet31| 87.20% | rec_r31_sar | [训练模型](https://paddleocr.bj.bcebos.com/dygraph_v2.1/rec/rec_r31_sar_train.tar) | |SEED|Aster_Resnet| 85.35% | rec_resnet_stn_bilstm_att | [训练模型](https://paddleocr.bj.bcebos.com/dygraph_v2.1/rec/rec_resnet_stn_bilstm_att.tar) | - -### 1.3 端到端算法 +**模型训练与推理** -PaddleOCR开源的端到端OCR算法列表: -- [x] PGNet([paper](https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf)) +- 以上文本识别算法的训练请参考文档教程中[模型训练/评估中的文本识别部分](./recognition.md)。 +- 上述模型中除PP-OCR系列模型以外,其余模型仅支持基于Python引擎的推理,具体内容可参考[基于Python预测引擎推理](./algorithm_inference.md) -> [PGNet使用教程](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/pgnet.md) -## 2. 模型训练 +## 2. 端到端算法 + +PaddleOCR开源的端到端OCR算法列表: +- [x] PGNet([paper](https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf)) -PaddleOCR文本检测算法的训练和使用请参考文档教程中[模型训练/评估中的文本检测部分](./detection.md)。文本识别算法的训练和使用请参考文档教程中[模型训练/评估中的文本识别部分](./recognition.md)。 +> [PGNet更多信息与教程](./pgnet.md) - -## 3. 模型推理 -上述模型中除PP-OCR系列模型以外,其余模型仅支持基于Python引擎的推理,具体内容可参考[基于Python预测引擎推理](./inference.md) diff --git a/doc/features.png b/doc/features.png index c06cce614921328b8a950cd25281146ddbba2ed2..ee3a7b88b715b8aaf4753a3c1e7f645c12585d81 100644 Binary files a/doc/features.png and b/doc/features.png differ