test=develop,update_docs

29ba105c · grasswolfs · c4a3ecdc · 29ba105c
隐藏空白更改
内联并排

Showing with 11 addition and 16 deletion

doc/doc_ch/FAQ.md doc/doc_ch/FAQ.md +11 -16

未找到文件。
--- a/doc/doc_ch/FAQ.md
+++ b/doc/doc_ch/FAQ.md
@@ -10,7 +10,7 @@
 ## PaddleOCR常见问题汇总(持续更新)

 * [【精选】OCR精选10个问题](#【精选】OCR精选10个问题)
-*  [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题)
+* [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题)
  * [基础知识3题](#基础知识)
  * [数据集4题](#数据集)
  * [模型训练调优6题](#模型训练调优)
@@ -60,24 +60,19 @@

 （1）检测阶段：先按照检测框和标注框的IOU评估，IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框，是采用多边形进行表示。

-检测准确率det_precision：正确的检测框个数在全部检测框的占比，主要是判断检测指标.
+检测准确率：正确的检测框个数在全部检测框的占比，主要是判断检测指标.

-检测召回率det_recall：正确的检测框个数在全部标注框的占比，主要是判断漏检的指标。
+检测召回率：正确的检测框个数在全部标注框的占比，主要是判断漏检的指标。

-检测 F1-Score：
-$$ F1\_Score= \frac{2 \times det\_precision \times det\_recall}{det\_precision+det\_recall}$$

 （2）识别阶段：
-字符识别准确率rec_precision，即正确识别的文本行占标注的文本行数量的比例，只有整行文本识别对才算正确识别。
+字符识别准确率，即正确识别的文本行占标注的文本行数量的比例，只有整行文本识别对才算正确识别。

 （3）端到端统计：
-端对端准确率e2e_precision：准确检测并正确识别文本行在全部标注文本行的占比；
-端到端召回率e2e_recall：准确检测并正确识别文本行在 检测到的文本行数量 的占比；准确检测的标准是检测框与标注框的IOU大于某个阈值，正确识别的的检测框中的文本与标注的文本相同。
+端对端准确率：准确检测并正确识别文本行在全部标注文本行的占比；
+端到端召回率：准确检测并正确识别文本行在 检测到的文本行数量 的占比；准确检测的标准是检测框与标注框的IOU大于某个阈值，正确识别的的检测框中的文本与标注的文本相同。


-端到端 F1-Score：
-$$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e2e\_recall}$$
-
 #### Q1.1.7：单张图上多语种并存识别（如单张图印刷体和手写文字并存），应该如何处理？

 **A**：单张图像中存在多种类型文本的情况很常见，典型的以学生的试卷为代表，一张图像同时存在手写体和印刷体两种文本，这类情况下，可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。
@@ -91,8 +86,8 @@ $$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e
 识别的话，520W左右的数据集（真实数据26W+合成数据500W）训练，超轻量模型：4卡V100，总共训练了5天左右。通用模型：4卡V100，共训练6天。

 超轻量模型训练分为2个阶段：
-<1>全量数据训练50epoch，耗时3天
-<2>合成数据+真实数据按照1:1数据采样，进行finetune训练200epoch，耗时2天
+(1)全量数据训练50epoch，耗时3天
+(2)合成数据+真实数据按照1:1数据采样，进行finetune训练200epoch，耗时2天

 通用模型训练：
 真实数据+合成数据，动态采样(1：1)训练，200epoch，耗时 6天左右。
@@ -448,7 +443,7 @@ ocr_system: 检测识别串联预测

 **A**：第一张图需要初始化，耗时较多。完成模型加载后，之后的预测时间很短。

-#### Q3.4.70：请问opt工具可以直接转int8量化后的模型为.nb文件吗
+#### Q3.4.7：请问opt工具可以直接转int8量化后的模型为.nb文件吗

 **A**：有的，PaddleLite提供完善的opt工具，可以参考[文档](https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html)

@@ -460,7 +455,7 @@ ocr_system: 检测识别串联预测

 **A**：目前不支持转ONNX

-#### Q3.4.1：使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
+#### Q3.4.10：使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr

 **A**：这个问题大概率是编译opt工具的Paddle-Lite不是develop分支，建议使用Paddle-Lite 的develop分支编译opt工具。

@@ -476,5 +471,5 @@ ocr_system: 检测识别串联预测

 **A**：训练的时候标注是整个文本行的标注，所以预测的也是文本行位置，如果要获取单字符位置信息，可以根据预测的文本，计算字符数量，再去根据整个文本行的位置信息，估计文本块中每个字符的位置。

-#### Q3.4.16：
+#### Q3.4.16：PaddleOCR模型部署方式有哪几种？
 **A**：目前有Inference部署，serving部署和手机端Paddle Lite部署，可根据不同场景做灵活的选择：Inference部署适用于本地离线部署，serving部署适用于云端部署，Paddle Lite部署适用于手机端集成。