Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleOCR
提交
ca1ba40f
P
PaddleOCR
项目概览
s920243400
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
ca1ba40f
编写于
12月 28, 2021
作者:
qq_25193841
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update README
Update README
上级
637dac99
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
20 addition
and
8 deletion
+20
-8
README.md
README.md
+1
-1
README_ch.md
README_ch.md
+14
-4
doc/doc_ch/training.md
doc/doc_ch/training.md
+5
-3
未找到文件。
README.md
浏览文件 @
ca1ba40f
...
@@ -39,7 +39,7 @@ PaddleOCR aims to create multilingual, awesome, leading, and practical OCR tools
...
@@ -39,7 +39,7 @@ PaddleOCR aims to create multilingual, awesome, leading, and practical OCR tools
-
General PP-OCR server series models: detection (47.1M) + direction classifier (1.4M) + recognition (94.9M) = 143.4M
-
General PP-OCR server series models: detection (47.1M) + direction classifier (1.4M) + recognition (94.9M) = 143.4M
-
Support Chinese, English, and digit recognition, vertical text recognition, and long text recognition
-
Support Chinese, English, and digit recognition, vertical text recognition, and long text recognition
-
Support multi-language recognition: about 80 languages like Korean, Japanese, German, French, etc
-
Support multi-language recognition: about 80 languages like Korean, Japanese, German, French, etc
-
document structurize system PP-Structure
-
PP-Structure: a document structurize system
-
support layout analysis and table recognition (support export to Excel)
-
support layout analysis and table recognition (support export to Excel)
-
support key information extraction
-
support key information extraction
-
support DocVQA
-
support DocVQA
...
...
README_ch.md
浏览文件 @
ca1ba40f
...
@@ -54,8 +54,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -54,8 +54,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
加入社区:微信扫描下方二维码加入官方交流群,与各行各业开发者充分交流,期待您的加入。
-
加入社区:微信扫描下方二维码加入官方交流群,与各行各业开发者充分交流,期待您的加入。
-
社区贡献:
[
社区贡献
](
./doc/doc_ch/thirdparty.md
)
文档中包含了社区用户
**使用PaddleOCR开发的各种工具、应用**
以及
**为PaddleOCR贡献的功能、优化的文档与代码**
等,是官方为社区开发者打造的荣誉墙、也是帮助优质项目宣传的广播站。如果您的OCR项目未被收集在文档中,可根据文档说明与我们联系。最新社区贡献可查看
[
此处
](
#社区贡献
)
。
-
社区贡献:
[
社区贡献
](
./doc/doc_ch/thirdparty.md
)
文档中包含了社区用户
**使用PaddleOCR开发的各种工具、应用**
以及
**为PaddleOCR贡献的功能、优化的文档与代码**
等,是官方为社区开发者打造的荣誉墙、也是帮助优质项目宣传的广播站。如果您的OCR项目未被收集在文档中,可根据文档说明与我们联系。最新社区贡献可查看
[
此处
](
#社区贡献
)
。
-
社区常规赛:作为社区贡献的具体承载形式,社区常规赛是面向OCR开发者的积分赛事。首届社区常规赛与
[
《动手学OCR · 十讲》课程
](
https://aistudio.baidu.com/aistudio/course/introduce/25207
)
联合推广。社区常规赛的赛题详情与报名方法可参考
[
链接
](
https://github.com/PaddlePaddle/PaddleOCR/issues/4982
)
。
-
社区常规赛:作为社区贡献的具体承载形式,社区常规赛是面向OCR开发者的积分赛事。首届社区常规赛与《动手学OCR · 十讲》课程联合推广,课程详情可参考
[
链接
](
https://aistudio.baidu.com/aistudio/course/introduce/25207
)
,课程奖励与作业说明可参考
[
链接
](
https://github.com/PaddlePaddle/PaddleOCR/issues/4982
)
。
<div
align=
"center"
>
<div
align=
"center"
>
<img
src=
"https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/dygraph/doc/joinus.PNG"
width =
"200"
height =
"200"
/>
<img
src=
"https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/dygraph/doc/joinus.PNG"
width =
"200"
height =
"200"
/>
...
@@ -64,11 +63,21 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -64,11 +63,21 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
## 零代码体验
## 零代码体验
-
在线网站体验:超轻量PP-OCR mobile模型体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
-
在线网站体验:超轻量PP-OCR mobile模型体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
-
移动端:
[
安装包DEMO下载地址
](
https://ai.baidu.com/easyedge/app/openSource?from=paddlelite
)(
基于EasyEdge和Paddle-Lite,
支持iOS和Android系统)
-
移动端:
[
安装包DEMO下载地址
](
https://ai.baidu.com/easyedge/app/openSource?from=paddlelite
)(
基于EasyEdge和Paddle-Lite,
支持iOS和Android系统)
<a
name=
"模型下载"
></a>
## PP-OCR系列模型列表(更新中)
| 模型简介 | 模型名称 | 推荐场景 | 检测模型 | 方向分类器 | 识别模型 |
| ------------------------------------- | ----------------------- | --------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| 中英文超轻量PP-OCRv2模型(13.0M) | ch_PP-OCRv2_xx | 移动端&服务器端 |
[
推理模型
](
https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv2_det_infer.tar
)
/
[
训练模型
](
https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv2_det_distill_train.tar
)
|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
)
/
[
预训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar
)
|
[
推理模型
](
https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv2_rec_infer.tar
)
/
[
训练模型
](
https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv2_rec_train.tar
)
|
| 中英文超轻量PP-OCR mobile模型(9.4M) | ch_ppocr_mobile_v2.0_xx | 移动端&服务器端 |
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar
)
/
[
预训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_train.tar
)
|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
)
/
[
预训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar
)
|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar
)
/
[
预训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_pre.tar
)
|
| 中英文通用PP-OCR server模型(143.4M) | ch_ppocr_server_v2.0_xx | 服务器端 |
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_infer.tar
)
/
[
预训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_train.tar
)
|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
)
/
[
预训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar
)
|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tar
)
/
[
预训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_pre.tar
)
|
更多模型下载(包括多语言),可以参考
[
PP-OCR 系列模型下载
](
./doc/doc_ch/models_list.md
)
## 文档教程
## 文档教程
-
[
运行环境准备
](
./doc/doc_ch/environment.md
)
-
[
运行环境准备
](
./doc/doc_ch/environment.md
)
-
[
快速开始(中英文/多语言/文档分析)
](
./doc/doc_ch/quickstart.md
)
-
[
快速开始(中英文/多语言/文档分析)
](
./doc/doc_ch/quickstart.md
)
-
[
PaddleOCR全景图与项目克隆
](
./doc/doc_ch/paddleOCR_overview.md
)
-
[
PaddleOCR全景图与项目克隆
](
./doc/doc_ch/paddleOCR_overview.md
)
...
@@ -80,6 +89,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -80,6 +89,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
[
文本检测
](
./doc/doc_ch/detection.md
)
-
[
文本检测
](
./doc/doc_ch/detection.md
)
-
[
文本识别
](
./doc/doc_ch/recognition.md
)
-
[
文本识别
](
./doc/doc_ch/recognition.md
)
-
[
文本方向分类器
](
./doc/doc_ch/angle_class.md
)
-
[
文本方向分类器
](
./doc/doc_ch/angle_class.md
)
-
[
知识蒸馏
](
./doc/doc_ch/knowledge_distillation.md
)
-
[
配置文件内容与生成
](
./doc/doc_ch/config.md
)
-
[
配置文件内容与生成
](
./doc/doc_ch/config.md
)
-
PP-OCR模型推理部署
-
PP-OCR模型推理部署
-
[
基于C++预测引擎推理
](
./deploy/cpp_infer/readme.md
)
-
[
基于C++预测引擎推理
](
./deploy/cpp_infer/readme.md
)
...
@@ -121,7 +131,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -121,7 +131,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
</div>
</div>
[1] PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面,采用19个有效策略,对各个模块的模型进行效果调优和瘦身(如绿框所示),最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。更多细节请参考PP-OCR技术方案 https://arxiv.org/abs/2009.09941
[1] PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面,采用19个有效策略,对各个模块的模型进行效果调优和瘦身(如绿框所示),最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。更多细节请参考PP-OCR技术方案 https://arxiv.org/abs/2009.09941
[
2] PP-OCRv2在PP-OCR的基础上,进一步在5个方面重点优化,检测模型采用CML协同互学习知识蒸馏策略和CopyPaste数据增广策略;识别模型采用LCNet轻量级骨干网络、UDML 改进知识蒸馏策略和
Enhanced CTC loss
损失函数改进(如上图红框所示),进一步在推理速度和预测效果上取得明显提升。更多细节请参考PP-OCRv2[技术报告
](
https://arxiv.org/abs/2109.03144
)
。
[
2] PP-OCRv2在PP-OCR的基础上,进一步在5个方面重点优化,检测模型采用CML协同互学习知识蒸馏策略和CopyPaste数据增广策略;识别模型采用LCNet轻量级骨干网络、UDML 改进知识蒸馏策略和
[Enhanced CTC loss
](
./doc/doc_ch/enhanced_ctc_loss.md
)
损失函数改进(如上图红框所示),进一步在推理速度和预测效果上取得明显提升。更多细节请参考PP-OCRv2
[
技术报告
](
https://arxiv.org/abs/2109.03144
)
。
<a
name=
"效果展示"
></a>
<a
name=
"效果展示"
></a>
...
...
doc/doc_ch/training.md
浏览文件 @
ca1ba40f
...
@@ -143,8 +143,10 @@ PaddleOCR主要聚焦通用OCR,如果有垂类需求,您可以用PaddleOCR+
...
@@ -143,8 +143,10 @@ PaddleOCR主要聚焦通用OCR,如果有垂类需求,您可以用PaddleOCR+
具体的训练教程可点击下方链接跳转:
具体的训练教程可点击下方链接跳转:
\-
[
文本检测模型训练
](
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch
/detection.md
)
-
[
文本检测模型训练
](
.
/detection.md
)
\-
[
文本识别模型训练
](
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/recognition.md
)
-
[
文本识别模型训练
](
./recognition.md
)
-
[
文本方向分类器训练
](
./angle_class.md
)
-
[
知识蒸馏
](
./knowledge_distillation.md
)
\-
[
文本方向分类器训练
](
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/angle_class.md
)
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录