Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
bc7f9fa0
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
bc7f9fa0
编写于
4月 07, 2022
作者:
M
MissPenguin
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update docs
上级
734c6d13
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
29 addition
and
4 deletion
+29
-4
README_ch.md
README_ch.md
+4
-3
doc/doc_ch/ocr_book.md
doc/doc_ch/ocr_book.md
+16
-0
doc/doc_ch/ppocr_introduction.md
doc/doc_ch/ppocr_introduction.md
+9
-1
未找到文件。
README_ch.md
浏览文件 @
bc7f9fa0
...
...
@@ -43,9 +43,9 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
## 社区、社区贡献与社区常规赛
-
加入社区
:微信扫描下方二维码加入官方交流群,与各行各业开发者充分交流,期待您的加入。
-
社区贡献:
[
社区贡献
](
./doc/doc_ch/thirdparty.md
)
文档中包含了社区用户
**使用PaddleOCR开发的各种工具、应用**
以及
**为PaddleOCR贡献的功能、优化的文档与代码**
等,是官方为社区开发者打造的荣誉墙、也是帮助优质项目宣传的广播站。如果您的OCR项目未被收集在文档中,可根据文档说明与我们联系
。
-
社区常规赛
:社区常规赛是面向OCR开发者的积分赛事,覆盖文档、代码、模型和应用四大类型,以季度为单位评选并发放奖励,赛题详情与报名方法可参考
[
链接
](
https://github.com/PaddlePaddle/PaddleOCR/issues/4982
)
。
-
**加入社区**
:微信扫描下方二维码加入官方交流群,与各行各业开发者充分交流,期待您的加入。
-
**社区贡献**
:
[
社区贡献
](
./doc/doc_ch/thirdparty.md
)
文档中包含了社区用户
**使用PaddleOCR开发的各种工具、应用**
以及
**为PaddleOCR贡献的功能、优化的文档与代码**
等,是官方为社区开发者打造的荣誉墙,也是帮助优质项目宣传的广播站
。
-
**社区常规赛**
:社区常规赛是面向OCR开发者的积分赛事,覆盖文档、代码、模型和应用四大类型,以季度为单位评选并发放奖励,赛题详情与报名方法可参考
[
链接
](
https://github.com/PaddlePaddle/PaddleOCR/issues/4982
)
。
<div
align=
"center"
>
<img
src=
"https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/dygraph/doc/joinus.PNG"
width =
"200"
height =
"200"
/>
...
...
@@ -113,6 +113,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
[
表格识别数据集
](
./doc/doc_ch/table_datasets.md
)
-
[
DocVQA数据集
](
./doc/doc_ch/docvqa_datasets.md
)
-
[
效果展示
](
#效果展示
)
-
[
《动手学OCR》电子书
](
./doc/doc_ch/ocr_book.md
)
-
FAQ
-
[
通用问题
](
./doc/doc_ch/FAQ.md
)
-
[
PaddleOCR实战问题
](
./doc/doc_ch/FAQ.md
)
...
...
doc/doc_ch/ocr_book.md
0 → 100644
浏览文件 @
bc7f9fa0
# 《动手学OCR》电子书
特点:
-
覆盖OCR全栈技术
-
理论实践相结合
-
Notebook交互式学习
-
配套教学视频
[
电子书下载
](
)
目录:
![](
)
[
notebook教程
](
../../notebook/notebook_ch/
)
[
教学视频
](
https://aistudio.baidu.com/aistudio/education/group/info/25207
)
\ No newline at end of file
doc/doc_ch/ppocr_introduction.md
浏览文件 @
bc7f9fa0
...
...
@@ -4,3 +4,11 @@
-
[
PP-OCRv2 pipeline
](
)
-
[
Benchmark
](
)
-
[
Modle zoo
](
)
## PP-OCRv2 Pipeline
<div
align=
"center"
>
<img
src=
"../ppocrv2_framework.jpg"
width=
"800"
>
</div>
[1] PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面,采用19个有效策略,对各个模块的模型进行效果调优和瘦身(如绿框所示),最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。更多细节请参考PP-OCR技术方案 https://arxiv.org/abs/2009.09941
[
2] PP-OCRv2在PP-OCR的基础上,进一步在5个方面重点优化,检测模型采用CML协同互学习知识蒸馏策略和CopyPaste数据增广策略;识别模型采用LCNet轻量级骨干网络、UDML 改进知识蒸馏策略和[Enhanced CTC loss
](
./doc/doc_ch/enhanced_ctc_loss.md
)
损失函数改进(如上图红框所示),进一步在推理速度和预测效果上取得明显提升。更多细节请参考PP-OCRv2
[
技术报告
](
https://arxiv.org/abs/2109.03144
)
。
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录