diff --git a/README.md b/README.md index 60ab666d47a7d1fa8d43648fc76e93b7fa192b5b..e08448f640e9e368019d6c120c03d67893196893 100644 --- a/README.md +++ b/README.md @@ -2,7 +2,6 @@ # 简介 PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别模型/工具库,助力使用者训练出更好的模型,并应用落地。 -【这里加上效果图】 ## 文档教程 - [快速安装](./doc/installation.md) @@ -11,7 +10,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别 ## 特性: - 超轻量级模型 - -(检测模型4.1M + 识别模型4.5M = 8.6M) + - (检测模型4.1M + 识别模型4.5M = 8.6M) - 支持竖排文字 - (单模型同时支持横排和竖排文字识别) - 支持长文本识别 @@ -21,7 +20,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别 ## 文本检测算法: -PaddleOCR提供的文本检测算法列表: +PaddleOCR开源的文本检测算法列表: - [EAST](https://arxiv.org/abs/1704.03155) - [DB](https://arxiv.org/abs/1911.08947) - [SAST](https://arxiv.org/abs/1908.05498) @@ -38,16 +37,14 @@ PaddleOCR文本检测算法的训练与使用请参考[文档](./doc/detection.m ## 文本识别算法: -PaddleOCR提供的文本识别算法列表: +PaddleOCR开源的文本识别算法列表: - (CRNN)[https://arxiv.org/abs/1507.05717] - [Rosetta](https://arxiv.org/abs/1910.05085) - [STAR-Net](http://www.bmva.org/bmvc/2016/papers/paper043/index.html) - [RARE](https://arxiv.org/abs/1603.03915v1) - [SRN]((https://arxiv.org/abs/2003.12294))(百度自研) -算法效果: - -以下指标是在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上的评测结果的平均。 +算法效果如下表所示,精度指标是在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上的评测结果的平均值。 |模型|骨干网络|ACC| |-|-|-| diff --git a/doc/detection.md b/doc/detection.md index f4295177bced37d60d01a2d409d540dd9858989e..5d54d780437a50ee878ffdcf5f99dfe9f1ec7d33 100644 --- a/doc/detection.md +++ b/doc/detection.md @@ -2,7 +2,7 @@ 本节以icdar15数据集为例,介绍PaddleOCR中检测模型的使用方式。 -## 3.1 数据准备 +## 数据准备 icdar2015数据集可以从[官网](https://rrc.cvc.uab.es/?ch=4&com=downloads)下载到,首次下载需注册。 将下载到的数据集解压到工作目录下,假设解压在/PaddleOCR/train_data/ 下。另外,PaddleOCR将零散的标注文件整理成单独的标注文件 @@ -30,7 +30,7 @@ json.dumps编码前的图像标注信息是包含多个字典的list,字典中 可以按照上述形式构建标注文件。 -## 3.2 快速启动训练 +## 快速启动训练 首先下载pretrain model,PaddleOCR的检测模型目前支持两种backbone,分别是MobileNetV3、ResNet50_vd, 您可以根据需求使用[PaddleClas](https://github.com/PaddlePaddle/PaddleClas/tree/master/ppcls/modeling/architectures)中的模型更换backbone。 @@ -55,7 +55,7 @@ python3 tools/train.py -c configs/det/det_db_mv3.yml python3 tools/train.py -c configs/det/det_db_mv3.yml -o Optimizer.base_lr=0.0001 ``` -## 3.3 指标评估 +## 指标评估 PaddleOCR计算三个OCR检测相关的指标,分别是:Precision、Recall、Hmean。 @@ -65,7 +65,7 @@ PaddleOCR计算三个OCR检测相关的指标,分别是:Precision、Recall python3 tools/eval.py -c configs/det/det_db_mv3.yml -o checkpoints="./output/best_accuracy" ``` -## 3.4 测试检测效果 +## 测试检测效果 测试单张图像的检测效果 ```