提交 29ba105c 编写于 作者: G grasswolfs

test=develop,update_docs

上级 c4a3ecdc
......@@ -10,7 +10,7 @@
## PaddleOCR常见问题汇总(持续更新)
* [【精选】OCR精选10个问题](#【精选】OCR精选10个问题)
* [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题)
* [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题)
* [基础知识3题](#基础知识)
* [数据集4题](#数据集)
* [模型训练调优6题](#模型训练调优)
......@@ -60,24 +60,19 @@
(1)检测阶段:先按照检测框和标注框的IOU评估,IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框,是采用多边形进行表示。
检测准确率det_precision:正确的检测框个数在全部检测框的占比,主要是判断检测指标.
检测准确率:正确的检测框个数在全部检测框的占比,主要是判断检测指标.
检测召回率det_recall:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
检测召回率:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
检测 F1-Score:
$$ F1\_Score= \frac{2 \times det\_precision \times det\_recall}{det\_precision+det\_recall}$$
(2)识别阶段:
字符识别准确率rec_precision,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。
字符识别准确率,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。
(3)端到端统计:
端对端准确率e2e_precision:准确检测并正确识别文本行在全部标注文本行的占比;
端到端召回率e2e_recall:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。
端对端准确率:准确检测并正确识别文本行在全部标注文本行的占比;
端到端召回率:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。
端到端 F1-Score:
$$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e2e\_recall}$$
#### Q1.1.7:单张图上多语种并存识别(如单张图印刷体和手写文字并存),应该如何处理?
**A**:单张图像中存在多种类型文本的情况很常见,典型的以学生的试卷为代表,一张图像同时存在手写体和印刷体两种文本,这类情况下,可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。
......@@ -91,8 +86,8 @@ $$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e
识别的话,520W左右的数据集(真实数据26W+合成数据500W)训练,超轻量模型:4卡V100,总共训练了5天左右。通用模型:4卡V100,共训练6天。
超轻量模型训练分为2个阶段:
<1>全量数据训练50epoch,耗时3天
<2>合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天
(1)全量数据训练50epoch,耗时3天
(2)合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天
通用模型训练:
真实数据+合成数据,动态采样(1:1)训练,200epoch,耗时 6天左右。
......@@ -448,7 +443,7 @@ ocr_system: 检测识别串联预测
**A**:第一张图需要初始化,耗时较多。完成模型加载后,之后的预测时间很短。
#### Q3.4.70:请问opt工具可以直接转int8量化后的模型为.nb文件吗
#### Q3.4.7:请问opt工具可以直接转int8量化后的模型为.nb文件吗
**A**:有的,PaddleLite提供完善的opt工具,可以参考[文档](https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html)
......@@ -460,7 +455,7 @@ ocr_system: 检测识别串联预测
**A**:目前不支持转ONNX
#### Q3.4.1:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
#### Q3.4.10:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
**A**:这个问题大概率是编译opt工具的Paddle-Lite不是develop分支,建议使用Paddle-Lite 的develop分支编译opt工具。
......@@ -476,5 +471,5 @@ ocr_system: 检测识别串联预测
**A**:训练的时候标注是整个文本行的标注,所以预测的也是文本行位置,如果要获取单字符位置信息,可以根据预测的文本,计算字符数量,再去根据整个文本行的位置信息,估计文本块中每个字符的位置。
#### Q3.4.16:
#### Q3.4.16:PaddleOCR模型部署方式有哪几种?
**A**:目前有Inference部署,serving部署和手机端Paddle Lite部署,可根据不同场景做灵活的选择:Inference部署适用于本地离线部署,serving部署适用于云端部署,Paddle Lite部署适用于手机端集成。
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册