diff --git a/README.md b/README.md index 70f07bab9223a6482ea571371364ad3a84bdc146..11e3ee55efce7a02634e22700b82050b2c251f54 100644 --- a/README.md +++ b/README.md @@ -33,6 +33,11 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力 - [**中文OCR模型快速使用**](./doc/doc_ch/quickstart.md) +- [基于EasyEdge的**移动端demo**体验](https://ai.baidu.com/easyedge/app/openSource?from=paddlelite)(点击本链接或直接扫描如下二维码) + + + + ## 中文OCR模型列表 |模型名称|模型简介|检测模型地址|识别模型地址|支持空格的识别模型地址| @@ -57,7 +62,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力 - 基于C++预测引擎推理(comming soon) - [服务化部署](./doc/doc_ch/serving.md) - [端侧部署](./deploy/lite/readme.md) - - Benchmark + - [Benchmark](./doc/doc_ch/benchmark.md) - 数据集 - [通用中英文OCR数据集](./doc/doc_ch/datasets.md) - 垂类多语言OCR数据集 @@ -126,7 +131,8 @@ PaddleOCR开源的文本识别算法列表: |RARE|Resnet34_vd|84.90%|rec_r34_vd_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_tps_bilstm_attn.tar)| |RARE|MobileNetV3|83.32%|rec_mv3_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_attn.tar)| -使用[LSVT](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#1icdar2019-lsvt)街景数据集根据真值将图crop出来30w数据,进行位置校准。此外基于LSVT语料生成500w合成数据训练中文模型,相关配置和预训练文件如下: +使用[LSVT](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#1icdar2019-lsvt)街景数据集根据真值将图crop出来30w数据,进行位置校准。此外基于LSVT语料生成500w合成数据训练中文模型,相关配置和预训练文件如下: + |模型|骨干网络|配置文件|预训练模型| |-|-|-|-| |超轻量中文模型|MobileNetV3|rec_chinese_lite_train.yml|[下载链接](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar)| diff --git a/doc/doc_ch/benchmark.md b/doc/doc_ch/benchmark.md new file mode 100644 index 0000000000000000000000000000000000000000..8540ec999b542987115a865b01a7565ceda2a6e8 --- /dev/null +++ b/doc/doc_ch/benchmark.md @@ -0,0 +1,21 @@ +# Benchmark + +本文给出了PaddleOCR超轻量中文模型(8.6M)在各平台的预测耗时benchmark。 + +## 测试数据 +- 从中文公开数据集[ICDAR2017-RCTW](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#ICDAR2017-RCTW-17)中随机采样**500**张图像。 +该集合大部分图片是通过手机摄像头在野外采集的。有些是截图。这些图片展示了各种各样的场景,包括街景、海报、菜单、室内场景和手机应用程序的截图。 + +## 评估指标 +在四种平台上的预测耗时指标如下: + +|长边尺寸(px)|T4(s)|V100(s)|Intel至强6148(s)|骁龙855(s)| +|-|-|-|-|-| +|960|0.092|0.057|0.656|0.354| +|640|0.067|0.045|0.386| 0.236| +|480|0.057|0.043|0.241| 0.175| + +说明: +- 评估耗时阶段为图像输入到结果输出的完整阶段,包括了图像的预处理和后处理。 +- `Intel至强6148`为服务器端CPU型号。 +- `骁龙855`为移动端处理平台型号。 \ No newline at end of file diff --git a/doc/doc_ch/quickstart.md b/doc/doc_ch/quickstart.md index c5385f0741f4a54b1e20059b0328c97ba7691ba9..3c834d3b29964c093b89c352cf247da2e1f990c1 100644 --- a/doc/doc_ch/quickstart.md +++ b/doc/doc_ch/quickstart.md @@ -88,5 +88,5 @@ python3 tools/infer/predict_system.py --image_dir="./doc/imgs_en/img_12.jpg" --d 此外,文档教程中也提供了中文OCR模型的其他预测部署方式: - 基于C++预测引擎推理(comming soon) -- [服务部署](./doc/doc_ch/serving.md) -- 端侧部署(comming soon) +- [服务部署](./serving.md) +- [端侧部署](../../deploy/lite/readme.md) diff --git a/doc/mobile_demo_qrcode.png b/doc/mobile_demo_qrcode.png new file mode 100644 index 0000000000000000000000000000000000000000..d965db6efe3330df9d2ecdf24f6491af295e7c05 Binary files /dev/null and b/doc/mobile_demo_qrcode.png differ