From 2916625a8f88f1e6d065fbdfe064ee910712c1b4 Mon Sep 17 00:00:00 2001 From: xiaoting <31891223+tink2123@users.noreply.github.com> Date: Wed, 29 Jun 2022 15:31:48 +0800 Subject: [PATCH] =?UTF-8?q?Update=20=E5=85=89=E5=8A=9F=E7=8E=87=E8=AE=A1?= =?UTF-8?q?=E6=95=B0=E7=A0=81=E7=AE=A1=E5=AD=97=E7=AC=A6=E8=AF=86=E5=88=AB?= =?UTF-8?q?.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...255\227\347\254\246\350\257\206\345\210\253.md" | 14 +++++++++----- 1 file changed, 9 insertions(+), 5 deletions(-) diff --git "a/applications/\345\205\211\345\212\237\347\216\207\350\256\241\346\225\260\347\240\201\347\256\241\345\255\227\347\254\246\350\257\206\345\210\253.md" "b/applications/\345\205\211\345\212\237\347\216\207\350\256\241\346\225\260\347\240\201\347\256\241\345\255\227\347\254\246\350\257\206\345\210\253.md" index d6c11259..2a35cb17 100644 --- "a/applications/\345\205\211\345\212\237\347\216\207\350\256\241\346\225\260\347\240\201\347\256\241\345\255\227\347\254\246\350\257\206\345\210\253.md" +++ "b/applications/\345\205\211\345\212\237\347\216\207\350\256\241\346\225\260\347\240\201\347\256\241\345\255\227\347\254\246\350\257\206\345\210\253.md" @@ -21,12 +21,16 @@ 第二步,使用文本识别模型获得准确的数字和单位信息。 -本项目主要介绍如何完成第二步文本识别部分,包括: +本项目主要介绍如何完成第二步文本识别部分,包括:真实评估集的建立、训练数据的合成、基于 PP-OCRv3 和 SVTR_Tiny 两个模型进行训练,以及评估和推理。 -* 真实评估集的建立 -* 训练数据的合成 -* 基于 PP-OCRv3 和 SVTR_Tiny 两个模型进行训练 -* 评估并推理 +本项目难点如下: + +- 光功率计数码管字符数据较少,难以获取。 +- 数码管中小数点占像素较少,容易漏识别。 + +针对以上问题, 本例选用 PP-OCRv3 和 SVTR_Tiny 两个高精度模型训练,同时提供了真实数据挖掘案例和数据合成案例。基于 PP-OCRv3 模型,在构建的真实评估集上精度从 52% 提升至 72%,SVTR_Tiny 模型精度可达到 78.9%。 + +aistudio项目链接: [光功率计数码管字符识别](https://aistudio.baidu.com/aistudio/projectdetail/4049044?contributionType=1) ## 2. PaddleOCR 快速使用 -- GitLab