Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
29ba105c
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
1 年多 前同步成功
通知
1532
Star
32963
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
29ba105c
编写于
8月 26, 2020
作者:
G
grasswolfs
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
test=develop,update_docs
上级
c4a3ecdc
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
11 addition
and
16 deletion
+11
-16
doc/doc_ch/FAQ.md
doc/doc_ch/FAQ.md
+11
-16
未找到文件。
doc/doc_ch/FAQ.md
浏览文件 @
29ba105c
...
...
@@ -10,7 +10,7 @@
## PaddleOCR常见问题汇总(持续更新)
*
[
【精选】OCR精选10个问题
](
#【精选】OCR精选10个问题
)
*
[
【理论篇】OCR通用21个问题
](
#【理论篇】OCR通用问题
)
*
[
【理论篇】OCR通用21个问题
](
#【理论篇】OCR通用问题
)
*
[
基础知识3题
](
#基础知识
)
*
[
数据集4题
](
#数据集
)
*
[
模型训练调优6题
](
#模型训练调优
)
...
...
@@ -60,24 +60,19 @@
(1)检测阶段:先按照检测框和标注框的IOU评估,IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框,是采用多边形进行表示。
检测准确率
det_precision
:正确的检测框个数在全部检测框的占比,主要是判断检测指标.
检测准确率:正确的检测框个数在全部检测框的占比,主要是判断检测指标.
检测召回率
det_recall
:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
检测召回率:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
检测 F1-Score:
$$ F1
\_
Score=
\f
rac{2
\t
imes det
\_
precision
\t
imes det
\_
recall}{det
\_
precision+det
\_
recall}$$
(2)识别阶段:
字符识别准确率
rec_precision
,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。
字符识别准确率,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。
(3)端到端统计:
端对端准确率
e2e_precision
:准确检测并正确识别文本行在全部标注文本行的占比;
端到端召回率
e2e_recall
:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。
端对端准确率:准确检测并正确识别文本行在全部标注文本行的占比;
端到端召回率:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。
端到端 F1-Score:
$$ F1
\_
Score=
\f
rac{2
\t
imes e2e
\_
precision
\t
imes e2e
\_
recall}{e2e
\_
precision+e2e
\_
recall}$$
#### Q1.1.7:单张图上多语种并存识别(如单张图印刷体和手写文字并存),应该如何处理?
**A**
:单张图像中存在多种类型文本的情况很常见,典型的以学生的试卷为代表,一张图像同时存在手写体和印刷体两种文本,这类情况下,可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。
...
...
@@ -91,8 +86,8 @@ $$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e
识别的话,520W左右的数据集(真实数据26W+合成数据500W)训练,超轻量模型:4卡V100,总共训练了5天左右。通用模型:4卡V100,共训练6天。
超轻量模型训练分为2个阶段:
<
1
>
全量数据训练50epoch,耗时3天
<
2
>
合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天
(1)
全量数据训练50epoch,耗时3天
(2)
合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天
通用模型训练:
真实数据+合成数据,动态采样(1:1)训练,200epoch,耗时 6天左右。
...
...
@@ -448,7 +443,7 @@ ocr_system: 检测识别串联预测
**A**
:第一张图需要初始化,耗时较多。完成模型加载后,之后的预测时间很短。
#### Q3.4.7
0
:请问opt工具可以直接转int8量化后的模型为.nb文件吗
#### Q3.4.7:请问opt工具可以直接转int8量化后的模型为.nb文件吗
**A**
:有的,PaddleLite提供完善的opt工具,可以参考
[
文档
](
https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html
)
...
...
@@ -460,7 +455,7 @@ ocr_system: 检测识别串联预测
**A**
:目前不支持转ONNX
#### Q3.4.1:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
#### Q3.4.1
0
:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
**A**
:这个问题大概率是编译opt工具的Paddle-Lite不是develop分支,建议使用Paddle-Lite 的develop分支编译opt工具。
...
...
@@ -476,5 +471,5 @@ ocr_system: 检测识别串联预测
**A**
:训练的时候标注是整个文本行的标注,所以预测的也是文本行位置,如果要获取单字符位置信息,可以根据预测的文本,计算字符数量,再去根据整个文本行的位置信息,估计文本块中每个字符的位置。
#### Q3.4.16:
#### Q3.4.16:
PaddleOCR模型部署方式有哪几种?
**A**
:目前有Inference部署,serving部署和手机端Paddle Lite部署,可根据不同场景做灵活的选择:Inference部署适用于本地离线部署,serving部署适用于云端部署,Paddle Lite部署适用于手机端集成。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录