Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
ad49dc98
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
ad49dc98
编写于
5月 30, 2020
作者:
D
dyning
提交者:
GitHub
5月 30, 2020
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #109 from dyning/develop
update readme and inference doc
上级
815388a3
907681e2
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
44 addition
and
20 deletion
+44
-20
README.md
README.md
+41
-17
doc/inference.md
doc/inference.md
+3
-3
未找到文件。
README.md
浏览文件 @
ad49dc98
## 简介
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
**近期更新**
-
2020.5.30,模型预测、训练支持Windows系统,识别结果的显示进行了优化
-
2020.5.30,开源通用中文OCR模型
-
2020.5.30,提供超轻量级中文OCR在线体验
## 特性
-
超轻量级中文OCR,总模型仅8.6M
-
单模型支持中英文数字组合识别、竖排文本识别、长文本识别
...
...
@@ -9,15 +13,18 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
多种文本检测训练算法,EAST、DB
-
多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE
### 已发布的中文模型:
### 支持的中文模型列表:
|模型名称|模型简介|检测模型地址|识别模型地址|
|-|-|-|-|
|chinese_db_crnn_mobile|超轻量级中文OCR模型|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar
)
|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar
)
|
|chinese_db_crnn_server|通用中文OCR模型|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db.tar
)
|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn.tar
)
|
|模型|检测|识别|
|-|-|-|
|8.6M中文模型|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar
)
|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar
)
|
|中文大模型|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db.tar
)
|
[
inference模型
](
https://paddleocr.bj.bcebos.com/ch_models%2Fch_rec_r34_vd_crnn_infer.tar
)
&
[
预训练模型
](
https://paddleocr.bj.bcebos.com/ch_models%2Fch_rec_r34_vd_crnn.tar
)
|
超轻量级中文OCR在线体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
**也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。**
## **超轻量级中文OCR体验**
## **超轻量级中文OCR
以及通用中文OCR
体验**
![](
doc/imgs_results/11.jpg
)
...
...
@@ -27,15 +34,25 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
请先参考
[
快速安装
](
./doc/installation.md
)
配置PaddleOCR运行环境。
#### 2.模型下载
#### 2.
inference
模型下载
#### (1)超轻量级中文OCR模型下载
```
mkdir inference && cd inference
# 下载
8.6M中文
模型的检测模型并解压
# 下载
超轻量级中文OCR
模型的检测模型并解压
wget https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar && tar xf ch_det_mv3_db_infer.tar
# 下载
8.6M中文
模型的识别模型并解压
# 下载
超轻量级中文OCR
模型的识别模型并解压
wget https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar && tar xf ch_rec_mv3_crnn_infer.tar
# inference模型文件包解压
cd ..
```
#### (2)通用中文OCR模型下载
```
mkdir inference && cd inference
# 下载通用中文OCR模型的检测模型并解压
wget https://paddleocr.bj.bcebos.com/ch_models/ch_det_r50_vd_db_infer.tar && tar xf ch_det_r50_vd_db_infer.tar
# 下载通用中文OCR模型的识别模型并解压
wget https://paddleocr.bj.bcebos.com/ch_models/ch_rec_r34_vd_crnn_infer.tar && tar xf ch_rec_r34_vd_crnn_infer.tar
cd ..
```
#### 3.单张图像或者图像集合预测
...
...
@@ -47,17 +64,27 @@ wget https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar && tar
export PYTHONPATH=.
# 预测image_dir指定的单张图像
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db
_infer/" --rec_model_dir="./inference/ch_rec_mv3_crnn_infer
/"
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db
/" --rec_model_dir="./inference/ch_rec_mv3_crnn
/"
# 预测image_dir指定的图像集合
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/" --det_model_dir="./inference/ch_det_mv3_db
_infer/" --rec_model_dir="./inference/ch_rec_mv3_crnn_infer
/"
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/" --det_model_dir="./inference/ch_det_mv3_db
/" --rec_model_dir="./inference/ch_rec_mv3_crnn
/"
# 如果想使用CPU进行预测,需设置use_gpu参数为False
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db_infer/" --rec_model_dir="./inference/ch_rec_mv3_crnn_infer/" --use_gpu=False
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db/" --rec_model_dir="./inference/ch_rec_mv3_crnn/" --use_gpu=False
```
通用中文OCR模型的体验可以按照上述步骤下载相应的模型,并且更新相关的参数,示例如下:
```
# 预测image_dir指定的单张图像
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_r50_vd_db/" --rec_model_dir="./inference/ch_rec_r34_vd_crnn/"
```
更多的文本检测、识别串联推理使用方式请参考文档教程中
[
基于预测引擎推理
](
./doc/inference.md
)
。
## 更新
-
2020.5.30,模型预测、训练支持Windows系统,识别结果的显示进行了优化
-
2020.5.30,开源通用中文OCR模型
-
2020.5.30,提供超轻量级中文OCR在线体验
## 文档教程
-
[
快速安装
](
./doc/installation.md
)
...
...
@@ -182,8 +209,5 @@ PaddleOCR文本识别算法的训练和使用请参考文档教程中[文本识
## 许可证书
本项目的发布受
<a
href=
"https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE"
>
Apache 2.0 license
</a>
许可认证。
## 版本更新
-
2020.5.29 发布中文检测、识别的大模型
## 如何贡献代码
我们非常欢迎你为PaddleOCR贡献代码,也十分感谢你的反馈。
doc/inference.md
浏览文件 @
ad49dc98
...
...
@@ -13,11 +13,11 @@ inference 模型(fluid.io.save_inference_model保存的模型)
下载超轻量级中文检测模型:
```
wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar && tar xf
ch_lite/ch_det_mv3_db.tar -C .
ch_lite/
wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar && tar xf
./ch_lite/ch_det_mv3_db.tar -C ./
ch_lite/
```
上述模型是以MobileNetV3为backbone训练的DB算法,将训练好的模型转换成inference模型只需要运行如下命令:
```
python3 tools/export_model.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./ch_lite/
ch_
det_mv3_db/best_accuracy Global.save_inference_dir=./inference/det_db/
python3 tools/export_model.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./ch_lite/det_mv3_db/best_accuracy Global.save_inference_dir=./inference/det_db/
```
转inference模型时,使用的配置文件和训练时使用的配置文件相同。另外,还需要设置配置文件中的Global.checkpoints、Global.save_inference_dir参数。
其中Global.checkpoints指向训练中保存的模型参数文件,Global.save_inference_dir是生成的inference模型要保存的目录。
...
...
@@ -32,7 +32,7 @@ inference/det_db/
下载超轻量中文识别模型:
```
wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/
rec_mv3_crnn.tar && tar xf ch_lite/rec_mv3_crnn.tar -C .
ch_lite/
wget -P ./ch_lite/ https://paddleocr.bj.bcebos.com/ch_models/
ch_rec_mv3_crnn.tar && tar xf ./ch_lite/ch_rec_mv3_crnn.tar -C ./
ch_lite/
```
识别模型转inference模型与检测的方式相同,如下:
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录