Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
16bc5469
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
16bc5469
编写于
10月 11, 2021
作者:
qq_25193841
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Fix docs
Fix docs
上级
a43d1137
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
16 addition
and
15 deletion
+16
-15
README.md
README.md
+1
-1
README_ch.md
README_ch.md
+5
-5
doc/doc_ch/training.md
doc/doc_ch/training.md
+10
-9
未找到文件。
README.md
浏览文件 @
16bc5469
...
@@ -118,7 +118,7 @@ For a new language request, please refer to [Guideline for new language_requests
...
@@ -118,7 +118,7 @@ For a new language request, please refer to [Guideline for new language_requests
-
[
Table Recognition
](
./ppstructure/table/README.md
)
-
[
Table Recognition
](
./ppstructure/table/README.md
)
-
Academic Circles
-
Academic Circles
-
[
Two-stage Algorithm
](
./doc/doc_en/algorithm_overview_en.md
)
-
[
Two-stage Algorithm
](
./doc/doc_en/algorithm_overview_en.md
)
-
[
PGNet Algorithm
](
./doc/doc_en/
algorithm_overview
_en.md
)
-
[
PGNet Algorithm
](
./doc/doc_en/
pgnet
_en.md
)
-
[
Python Inference
](
./doc/doc_en/inference_en.md
)
-
[
Python Inference
](
./doc/doc_en/inference_en.md
)
-
[
Use PaddleOCR Architecture to Add New Algorithms
](
./doc/doc_en/add_new_algorithm_en.md
)
-
[
Use PaddleOCR Architecture to Add New Algorithms
](
./doc/doc_en/add_new_algorithm_en.md
)
-
Data Annotation and Synthesis
-
Data Annotation and Synthesis
...
...
README_ch.md
浏览文件 @
16bc5469
...
@@ -108,16 +108,16 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
...
@@ -108,16 +108,16 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力
-
[
PP-Structure信息提取
](
./ppstructure/README_ch.md
)
-
[
PP-Structure信息提取
](
./ppstructure/README_ch.md
)
-
[
版面分析
](
./ppstructure/layout/README_ch.md
)
-
[
版面分析
](
./ppstructure/layout/README_ch.md
)
-
[
表格识别
](
./ppstructure/table/README_ch.md
)
-
[
表格识别
](
./ppstructure/table/README_ch.md
)
-
数据标注与合成
-
[
半自动标注工具PPOCRLabel
](
./PPOCRLabel/README_ch.md
)
-
[
数据合成工具Style-Text
](
./StyleText/README_ch.md
)
-
[
其它数据标注工具
](
./doc/doc_ch/data_annotation.md
)
-
[
其它数据合成工具
](
./doc/doc_ch/data_synthesis.md
)
-
OCR学术圈
-
OCR学术圈
-
[
两阶段算法
](
./doc/doc_ch/algorithm_overview.md
)
-
[
两阶段算法
](
./doc/doc_ch/algorithm_overview.md
)
-
[
端到端PGNet算法
](
./doc/doc_ch/pgnet.md
)
-
[
端到端PGNet算法
](
./doc/doc_ch/pgnet.md
)
-
[
基于Python脚本预测引擎推理
](
./doc/doc_ch/inference.md
)
-
[
基于Python脚本预测引擎推理
](
./doc/doc_ch/inference.md
)
-
[
使用PaddleOCR架构添加新算法
](
./doc/doc_ch/add_new_algorithm.md
)
-
[
使用PaddleOCR架构添加新算法
](
./doc/doc_ch/add_new_algorithm.md
)
-
数据标注与合成
-
[
半自动标注工具PPOCRLabel
](
./PPOCRLabel/README_ch.md
)
-
[
数据合成工具Style-Text
](
./StyleText/README_ch.md
)
-
[
其它数据标注工具
](
./doc/doc_ch/data_annotation.md
)
-
[
其它数据合成工具
](
./doc/doc_ch/data_synthesis.md
)
-
数据集
-
数据集
-
[
通用中英文OCR数据集
](
./doc/doc_ch/datasets.md
)
-
[
通用中英文OCR数据集
](
./doc/doc_ch/datasets.md
)
-
[
手写中文OCR数据集
](
./doc/doc_ch/handwritten_datasets.md
)
-
[
手写中文OCR数据集
](
./doc/doc_ch/handwritten_datasets.md
)
...
...
doc/doc_ch/training.md
浏览文件 @
16bc5469
...
@@ -4,7 +4,7 @@
...
@@ -4,7 +4,7 @@
同时会简单介绍PaddleOCR模型训练数据的组成部分,以及如何在垂类场景中准备数据finetune模型。
同时会简单介绍PaddleOCR模型训练数据的组成部分,以及如何在垂类场景中准备数据finetune模型。
-
[
1.配置文件
](
#配置文件
)
-
[
1.配置文件
说明
](
#配置文件
)
-
[
2. 基本概念
](
#基本概念
)
-
[
2. 基本概念
](
#基本概念
)
*
[
2.1 学习率
](
#学习率
)
*
[
2.1 学习率
](
#学习率
)
*
[
2.2 正则化
](
#正则化
)
*
[
2.2 正则化
](
#正则化
)
...
@@ -30,7 +30,7 @@ PaddleOCR模型使用配置文件管理网络训练、评估的参数。在配
...
@@ -30,7 +30,7 @@ PaddleOCR模型使用配置文件管理网络训练、评估的参数。在配
模型训练过程中需要手动调整一些超参数,帮助模型以最小的代价获得最优指标。不同的数据量可能需要不同的超参,当您希望在自己的数据上finetune或对模型效果调优时,有以下几个参数调整策略可供参考:
模型训练过程中需要手动调整一些超参数,帮助模型以最小的代价获得最优指标。不同的数据量可能需要不同的超参,当您希望在自己的数据上finetune或对模型效果调优时,有以下几个参数调整策略可供参考:
<a
name=
"学习率"
></a>
<a
name=
"学习率"
></a>
###
1
.1 学习率
###
2
.1 学习率
学习率是训练神经网络的重要超参数之一,它代表在每一次迭代中梯度向损失函数最优解移动的步长。
学习率是训练神经网络的重要超参数之一,它代表在每一次迭代中梯度向损失函数最优解移动的步长。
在PaddleOCR中提供了多种学习率更新策略,可以通过配置文件修改,例如:
在PaddleOCR中提供了多种学习率更新策略,可以通过配置文件修改,例如:
...
@@ -49,7 +49,7 @@ Piecewise 代表分段常数衰减,在不同的学习阶段指定不同的学
...
@@ -49,7 +49,7 @@ Piecewise 代表分段常数衰减,在不同的学习阶段指定不同的学
warmup_epoch 代表在前5个epoch中,学习率将逐渐从0增加到base_lr。全部策略可以参考代码
[
learning_rate.py
](
../../ppocr/optimizer/learning_rate.py
)
。
warmup_epoch 代表在前5个epoch中,学习率将逐渐从0增加到base_lr。全部策略可以参考代码
[
learning_rate.py
](
../../ppocr/optimizer/learning_rate.py
)
。
<a
name=
"正则化"
></a>
<a
name=
"正则化"
></a>
###
1
.2 正则化
###
2
.2 正则化
正则化可以有效的避免算法过拟合,PaddleOCR中提供了L1、L2正则方法,L1 和 L2 正则化是最常用的正则化方法。L1 正则化向目标函数添加正则化项,以减少参数的绝对值总和;而 L2 正则化中,添加正则化项的目的在于减少参数平方的总和。配置方法如下:
正则化可以有效的避免算法过拟合,PaddleOCR中提供了L1、L2正则方法,L1 和 L2 正则化是最常用的正则化方法。L1 正则化向目标函数添加正则化项,以减少参数的绝对值总和;而 L2 正则化中,添加正则化项的目的在于减少参数平方的总和。配置方法如下:
...
@@ -62,7 +62,7 @@ Optimizer:
...
@@ -62,7 +62,7 @@ Optimizer:
```
```
<a
name=
"评估指标"
></a>
<a
name=
"评估指标"
></a>
###
1
.3 评估指标
###
2
.3 评估指标
(1)检测阶段:先按照检测框和标注框的IOU评估,IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框,是采用多边形进行表示。检测准确率:正确的检测框个数在全部检测框的占比,主要是判断检测指标。检测召回率:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
(1)检测阶段:先按照检测框和标注框的IOU评估,IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框,是采用多边形进行表示。检测准确率:正确的检测框个数在全部检测框的占比,主要是判断检测指标。检测召回率:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
...
@@ -72,10 +72,10 @@ Optimizer:
...
@@ -72,10 +72,10 @@ Optimizer:
<a
name=
"数据与垂类场景"
></a>
<a
name=
"数据与垂类场景"
></a>
##
2
. 数据与垂类场景
##
3
. 数据与垂类场景
<a
name=
"训练数据"
></a>
<a
name=
"训练数据"
></a>
###
2
.1 训练数据
###
3
.1 训练数据
目前开源的模型,数据集和量级如下:
目前开源的模型,数据集和量级如下:
- 检测:
- 检测:
...
@@ -90,13 +90,14 @@ Optimizer:
...
@@ -90,13 +90,14 @@ Optimizer:
其中,公开数据集都是开源的,用户可自行搜索下载,也可参考
[
中文数据集
](
./datasets.md
)
,合成数据暂不开源,用户可使用开源合成工具自行合成,可参考的合成工具包括
[
text_renderer
](
https://github.com/Sanster/text_renderer
)
、
[
SynthText
](
https://github.com/ankush-me/SynthText
)
、
[
TextRecognitionDataGenerator
](
https://github.com/Belval/TextRecognitionDataGenerator
)
等。
其中,公开数据集都是开源的,用户可自行搜索下载,也可参考
[
中文数据集
](
./datasets.md
)
,合成数据暂不开源,用户可使用开源合成工具自行合成,可参考的合成工具包括
[
text_renderer
](
https://github.com/Sanster/text_renderer
)
、
[
SynthText
](
https://github.com/ankush-me/SynthText
)
、
[
TextRecognitionDataGenerator
](
https://github.com/Belval/TextRecognitionDataGenerator
)
等。
<a
name=
"垂类场景"
></a>
<a
name=
"垂类场景"
></a>
###
2
.2 垂类场景
###
3
.2 垂类场景
PaddleOCR主要聚焦通用OCR,如果有垂类需求,您可以用PaddleOCR+垂类数据自己训练;
PaddleOCR主要聚焦通用OCR,如果有垂类需求,您可以用PaddleOCR+垂类数据自己训练;
如果缺少带标注的数据,或者不想投入研发成本,建议直接调用开放的API,开放的API覆盖了目前比较常见的一些垂类。
如果缺少带标注的数据,或者不想投入研发成本,建议直接调用开放的API,开放的API覆盖了目前比较常见的一些垂类。
<a
name=
"自己构建数据集"
></a>
<a
name=
"自己构建数据集"
></a>
### 2.3 自己构建数据集
### 3.3 自己构建数据集
在构建数据集时有几个经验可供参考:
在构建数据集时有几个经验可供参考:
...
@@ -114,7 +115,7 @@ PaddleOCR主要聚焦通用OCR,如果有垂类需求,您可以用PaddleOCR+
...
@@ -114,7 +115,7 @@ PaddleOCR主要聚焦通用OCR,如果有垂类需求,您可以用PaddleOCR+
<a
name=
"常见问题"
></a>
<a
name=
"常见问题"
></a>
##
3
. 常见问题
##
4
. 常见问题
**Q**
:训练CRNN识别时,如何选择合适的网络输入shape?
**Q**
:训练CRNN识别时,如何选择合适的网络输入shape?
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录