Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
5488aaed
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
5488aaed
编写于
4月 14, 2022
作者:
M
MissPenguin
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update doc
上级
092287ef
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
44 addition
and
54 deletion
+44
-54
README_ch.md
README_ch.md
+15
-6
doc/doc_ch/algorithm_det_db.md
doc/doc_ch/algorithm_det_db.md
+28
-47
doc/doc_ch/application.md
doc/doc_ch/application.md
+1
-0
doc/doc_ch/quickstart.md
doc/doc_ch/quickstart.md
+0
-1
doc/features.png
doc/features.png
+0
-0
未找到文件。
README_ch.md
浏览文件 @
5488aaed
...
@@ -35,19 +35,19 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -35,19 +35,19 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
> 上述内容的使用方法建议从文档教程中的快速开始体验
> 上述内容的使用方法建议从文档教程中的快速开始体验
##
零代码体验
##
快速开始
-
在线网站体验:超轻量PP-OCR mobile模型体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
-
在线网站体验:超轻量PP-OCR mobile模型体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
-
移动端:
[
安装包DEMO下载地址
](
https://ai.baidu.com/easyedge/app/openSource?from=paddlelite
)(
基于EasyEdge和Paddle-Lite,
支持iOS和Android系统)
-
移动端
demo体验
:
[
安装包DEMO下载地址
](
https://ai.baidu.com/easyedge/app/openSource?from=paddlelite
)(
基于EasyEdge和Paddle-Lite,
支持iOS和Android系统)
-
[
快速开始(中英文/多语言/文档分析)
](
./doc/doc_ch/quickstart.md
)
<a
name=
"电子书"
></a>
## 《动手学OCR》电子书
## 《动手学OCR》电子书
-
[
《动手学OCR》电子书📚
](
./doc/doc_ch/ocr_book.md
)
-
[
《动手学OCR》电子书📚
](
./doc/doc_ch/ocr_book.md
)
<a
name=
"贡献代码"
></a>
<a
name=
"开源社区"
></a>
## 开源社区
## 社区、社区贡献与社区常规赛
-
**加入社区**
👬:微信扫描下方二维码加入官方交流群,与各行各业开发者充分交流,期待您的加入。
-
**加入社区**
👬:微信扫描下方二维码加入官方交流群,与各行各业开发者充分交流,期待您的加入。
-
**社区贡献**
🏅️:
[
社区贡献
](
./doc/doc_ch/thirdparty.md
)
文档中包含了社区用户
**使用PaddleOCR开发的各种工具、应用**
以及
**为PaddleOCR贡献的功能、优化的文档与代码**
等,是官方为社区开发者打造的荣誉墙,也是帮助优质项目宣传的广播站。
-
**社区贡献**
🏅️:
[
社区贡献
](
./doc/doc_ch/thirdparty.md
)
文档中包含了社区用户
**使用PaddleOCR开发的各种工具、应用**
以及
**为PaddleOCR贡献的功能、优化的文档与代码**
等,是官方为社区开发者打造的荣誉墙,也是帮助优质项目宣传的广播站。
...
@@ -74,6 +74,12 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -74,6 +74,12 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
[
运行环境准备
](
./doc/doc_ch/environment.md
)
-
[
运行环境准备
](
./doc/doc_ch/environment.md
)
-
[
快速开始(中英文/多语言/文档分析)
](
./doc/doc_ch/quickstart.md
)
-
[
快速开始(中英文/多语言/文档分析)
](
./doc/doc_ch/quickstart.md
)
-
[
PP-OCR文本检测识别🔥
](
./doc/doc_ch/ppocr_introduction.md
)
-
[
PP-OCR文本检测识别🔥
](
./doc/doc_ch/ppocr_introduction.md
)
|
[
模型库
](
./doc/doc_ch/models_list.md
)
|
[
模型训练
](
./doc/doc_ch/training.md
)
|模型压缩|
[
推理部署
](
./deploy/readme_ch.md
)
|
| :-------: | :----------: | :---------: | :---------: |
|
[
模型库
](
./doc/doc_ch/models_list.md
)
|
[
文本检测
](
./doc/doc_ch/detection.md
)
<br>
[
文本识别
](
./doc/doc_ch/recognition.md
)
<br>
[
文本方向分类器
](
./doc/doc_ch/angle_class.md
)
|
[
模型量化
](
./deploy/slim/quantization/README.md
)
<br>
[
模型裁剪
](
./deploy/slim/prune/README.md
)
<br>
[
知识蒸馏
](
./doc/doc_ch/knowledge_distillation.md
)
|
[
基于Python预测引擎推理
](
./doc/doc_ch/inference_ppocr.md
)
<br>
[
基于C++预测引擎推理
](
./deploy/cpp_infer/readme.md
)
<br>
[
服务化部署
](
./deploy/pdserving/README_CN.md
)
<br>
[
端侧部署
](
./deploy/lite/readme.md
)
<br>
[
Paddle2ONNX模型转化与预测
](
./deploy/paddle2onnx/readme.md
)
<br>
[
Benchmark
](
./doc/doc_ch/benchmark.md
)
|
-
-
[
模型库
](
./doc/doc_ch/models_list.md
)
-
[
模型库
](
./doc/doc_ch/models_list.md
)
-
[
模型训练
](
./doc/doc_ch/training.md
)
-
[
模型训练
](
./doc/doc_ch/training.md
)
-
[
文本检测
](
./doc/doc_ch/detection.md
)
-
[
文本检测
](
./doc/doc_ch/detection.md
)
...
@@ -105,6 +111,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -105,6 +111,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
[
文本识别算法
](
./doc/doc_ch/algorithm_overview.md#12-%E6%96%87%E6%9C%AC%E8%AF%86%E5%88%AB%E7%AE%97%E6%B3%95
)
-
[
文本识别算法
](
./doc/doc_ch/algorithm_overview.md#12-%E6%96%87%E6%9C%AC%E8%AF%86%E5%88%AB%E7%AE%97%E6%B3%95
)
-
[
端到端算法
](
./doc/doc_ch/algorithm_overview.md#2-%E6%96%87%E6%9C%AC%E8%AF%86%E5%88%AB%E7%AE%97%E6%B3%95
)
-
[
端到端算法
](
./doc/doc_ch/algorithm_overview.md#2-%E6%96%87%E6%9C%AC%E8%AF%86%E5%88%AB%E7%AE%97%E6%B3%95
)
-
[
使用PaddleOCR架构添加新算法
](
./doc/doc_ch/add_new_algorithm.md
)
-
[
使用PaddleOCR架构添加新算法
](
./doc/doc_ch/add_new_algorithm.md
)
-
[
场景应用
](
./doc/doc_ch/application.md
)
-
数据标注与合成
-
数据标注与合成
-
[
半自动标注工具PPOCRLabel
](
./PPOCRLabel/README_ch.md
)
-
[
半自动标注工具PPOCRLabel
](
./PPOCRLabel/README_ch.md
)
-
[
数据合成工具Style-Text
](
./StyleText/README_ch.md
)
-
[
数据合成工具Style-Text
](
./StyleText/README_ch.md
)
...
@@ -119,6 +126,8 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -119,6 +126,8 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
[
DocVQA数据集
](
./doc/doc_ch/docvqa_datasets.md
)
-
[
DocVQA数据集
](
./doc/doc_ch/docvqa_datasets.md
)
-
[
代码组织结构
](
./doc/doc_ch/tree.md
)
-
[
代码组织结构
](
./doc/doc_ch/tree.md
)
-
[
效果展示
](
#效果展示
)
-
[
效果展示
](
#效果展示
)
-
[
《动手学OCR》电子书📚
](
#电子书
)
-
[
开源社区
](
#开源社区
)
-
FAQ
-
FAQ
-
[
通用问题
](
./doc/doc_ch/FAQ.md
)
-
[
通用问题
](
./doc/doc_ch/FAQ.md
)
-
[
PaddleOCR实战问题
](
./doc/doc_ch/FAQ.md
)
-
[
PaddleOCR实战问题
](
./doc/doc_ch/FAQ.md
)
...
...
doc/doc_ch/algorithm_det_db.md
浏览文件 @
5488aaed
...
@@ -2,10 +2,16 @@
...
@@ -2,10 +2,16 @@
-
[
1. 算法简介
](
#1
)
-
[
1. 算法简介
](
#1
)
-
[
2. 环境配置
](
#2
)
-
[
2. 环境配置
](
#2
)
-
[
3. 快速使用
](
#3
)
-
[
3. 模型训练、评估、预测
](
#3
)
-
[
4. 模型训练、评估、预测
](
#4
)
-
[
3.1 训练
](
#3-1
)
-
[
5. 推理部署
](
#5
)
-
[
3.2 评估
](
#3-2
)
-
[
6. FAQ
](
#6
)
-
[
3.3 预测
](
#3-3
)
-
[
4. 推理部署
](
#4
)
-
[
4.1 Python推理
](
#4-1
)
-
[
4.2 C++推理
](
#4-2
)
-
[
4.3 Serving服务化部署
](
#4-3
)
-
[
4.4 更多推理部署
](
#4-4
)
-
[
5. FAQ
](
#5
)
<a
name=
"1"
></a>
<a
name=
"1"
></a>
## 1. 算法简介
## 1. 算法简介
...
@@ -29,50 +35,22 @@
...
@@ -29,50 +35,22 @@
<a
name=
"3"
></a>
<a
name=
"3"
></a>
## 3. 快速使用
## 3. 模型训练、评估、预测
参考本节,可以直接下载训好的模型,进行基于训练引擎的模型预测。
### 训练模型下载
根据第1节给出的模型列表,选择下载训练模型:
```
bash
mkdir
trained_models
&&
cd
trained_models
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/det_mv3_db_v2.0_train.tar
&&
tar
xf det_mv3_db_v2.0_train.tar
cd
..
```
*
windows 环境下如果没有安装wget,下载模型时可将链接复制到浏览器中下载,并解压放置在相应目录下
解压完毕后应有如下文件结构:
<a
name=
"3-1"
></a>
```
### 3.1 训练
├── det_mv3_db_v2.0_train
│ ├── best_accuracy.states
│ ├── best_accuracy.pdparams
│ ├── best_accuracy.pdopt
│ └── train.log
```
### 单张图像或者图像集合预测
```
bash
# 预测image_dir指定的单张图像
python3 tools/infer/predict_e2e.py
--e2e_algorithm
=
"PGNet"
--image_dir
=
"./doc/imgs_en/img623.jpg"
--e2e_model_dir
=
"./inference/e2e_server_pgnetA_infer/"
--e2e_pgnet_valid_set
=
"totaltext"
# 预测image_dir指定的图像集合
<a
name=
"3-2"
></a>
python3 tools/infer/predict_e2e.py
--e2e_algorithm
=
"PGNet"
--image_dir
=
"./doc/imgs_en/"
--e2e_model_dir
=
"./inference/e2e_server_pgnetA_infer/"
--e2e_pgnet_valid_set
=
"totaltext"
### 3.2 评估
# 如果想使用CPU进行预测,需设置use_gpu参数为False
<a
name=
"3-3"
></a>
python3 tools/infer/predict_e2e.py
--e2e_algorithm
=
"PGNet"
--image_dir
=
"./doc/imgs_en/img623.jpg"
--e2e_model_dir
=
"./inference/e2e_server_pgnetA_infer/"
--e2e_pgnet_valid_set
=
"totaltext"
--use_gpu
=
False
### 3.3 预测
```
### 可视化结果
可视化文本检测结果默认保存到./inference_results文件夹里面,结果文件的名称前缀为'e2e_res'。结果示例如下:
![](
../imgs_results/e2e_res_img623_pgnet.jpg
)
<a
name=
"4"
></a>
<a
name=
"4"
></a>
## 4. 模型训练、评估、预测
## 4. 推理部署
### 4.1 训练
### 4.2 评估
### 4.3 预测
<a
name=
"5"
></a>
<a
name=
"4-1"
></a>
## 5. 推理部署
### 4.1 Python推理
### 5.1 Python推理
首先将DB文本检测训练过程中保存的模型,转换成inference model。以基于Resnet50_vd骨干网络,在ICDAR2015英文数据集训练的模型为例(
[
模型下载地址
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/det_r50_vd_db_v2.0_train.tar
)
),可以使用如下命令进行转换:
首先将DB文本检测训练过程中保存的模型,转换成inference model。以基于Resnet50_vd骨干网络,在ICDAR2015英文数据集训练的模型为例(
[
模型下载地址
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/det_r50_vd_db_v2.0_train.tar
)
),可以使用如下命令进行转换:
```
```
...
@@ -91,17 +69,20 @@ python3 tools/infer/predict_det.py --image_dir="./doc/imgs_en/img_10.jpg" --det_
...
@@ -91,17 +69,20 @@ python3 tools/infer/predict_det.py --image_dir="./doc/imgs_en/img_10.jpg" --det_
**注意**
:由于ICDAR2015数据集只有1000张训练图像,且主要针对英文场景,所以上述模型对中文文本图像检测效果会比较差。
**注意**
:由于ICDAR2015数据集只有1000张训练图像,且主要针对英文场景,所以上述模型对中文文本图像检测效果会比较差。
### 5.2 C++推理
<a
name=
"4-2"
></a>
### 4.2 C++推理
敬请期待
敬请期待
### 5.3 Serving服务化部署
<a
name=
"4-3"
></a>
### 4.3 Serving服务化部署
敬请期待
敬请期待
### 5.4 Paddle2ONNX推理
<a
name=
"4-4"
></a>
### 4.4 更多推理部署
敬请期待
敬请期待
<a
name=
"
6
"
></a>
<a
name=
"
5
"
></a>
##
6
. FAQ
##
5
. FAQ
## 引用
## 引用
...
...
doc/doc_ch/application.md
0 → 100644
浏览文件 @
5488aaed
# 场景应用
\ No newline at end of file
doc/doc_ch/quickstart.md
浏览文件 @
5488aaed
...
@@ -3,7 +3,6 @@
...
@@ -3,7 +3,6 @@
-
[
1. 安装
](
#1
)
-
[
1. 安装
](
#1
)
-
[
1.1 安装PaddlePaddle
](
#11
)
-
[
1.1 安装PaddlePaddle
](
#11
)
-
[
1.2 安装PaddleOCR whl包
](
#12
)
-
[
1.2 安装PaddleOCR whl包
](
#12
)
-
[
2. 便捷使用
](
#2
)
-
[
2. 便捷使用
](
#2
)
-
[
2.1 命令行使用
](
#21
)
-
[
2.1 命令行使用
](
#21
)
-
[
2.1.1 中英文模型
](
#211
)
-
[
2.1.1 中英文模型
](
#211
)
...
...
doc/features.png
查看替换文件 @
092287ef
浏览文件 @
5488aaed
999.2 KB
|
W:
|
H:
1.2 MB
|
W:
|
H:
2-up
Swipe
Onion skin
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录