Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
46fafa29
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
46fafa29
编写于
6月 29, 2022
作者:
A
an1018
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update
上级
d554037e
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
22 addition
and
20 deletion
+22
-20
applications/PCB字符识别/PCB字符识别.md
applications/PCB字符识别/PCB字符识别.md
+5
-1
applications/多模态表单识别.md
applications/多模态表单识别.md
+17
-19
未找到文件。
applications/PCB字符识别/PCB字符识别.md
浏览文件 @
46fafa29
...
...
@@ -206,7 +206,11 @@ Eval.dataset.transforms.DetResizeForTest: 尺寸
limit_type: 'min'
```
然后执行评估代码
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div
align=
"left"
>
<img
src=
"https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e"
width =
"150"
height =
"150"
/>
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型评估。
```
python
...
...
applications/多模态表单识别.md
浏览文件 @
46fafa29
...
...
@@ -7,12 +7,12 @@
-
[
3.2 转换为PaddleOCR检测和识别格式
](
#32-转换为paddleocr检测和识别格式
)
-
[
4 OCR
](
#4-ocr
)
-
[
4.1 文本检测
](
#41-文本检测
)
-
[
**4.1.1 方案1:预训练模型**
](
#411-方案1预训练模型
)
-
[
**4.1.2 方案2:XFUND数据集+fine-tune**
](
#412-方案2xfund数据集fine-tune
)
-
[
4.1.1 方案1:预训练模型
](
#411-方案1预训练模型
)
-
[
4.1.2 方案2:XFUND数据集+fine-tune
](
#412-方案2xfund数据集fine-tune
)
-
[
4.2 文本识别
](
#42-文本识别
)
-
[
**4.2.1 方案1:预训练模型**
](
#421-方案1预训练模型
)
-
[
**4.2.2 方案2:XFUND数据集+finetune**
](
#422-方案2xfund数据集finetune
)
-
[
**4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据**
](
#423-方案3xfund数据集finetune真实通用识别数据
)
-
[
4.2.1 方案1:预训练模型
](
#421-方案1预训练模型
)
-
[
4.2.2 方案2:XFUND数据集+finetune
](
#422-方案2xfund数据集finetune
)
-
[
4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据
](
#423-方案3xfund数据集finetune真实通用识别数据
)
-
[
5 文档视觉问答(DOC-VQA)
](
#5-文档视觉问答doc-vqa
)
-
[
5.1 SER
](
#51-ser
)
-
[
5.1.1 模型训练
](
#511-模型训练
)
...
...
@@ -195,7 +195,7 @@ python trans_xfund_data.py
-
**PP-OCRv2中英文超轻量检测预训练模型**
-
**XFUND数据集+fine-tune**
####
**4.1.1 方案1:预训练模型**
####
4.1.1 方案1:预训练模型
**1)下载预训练模型**
...
...
@@ -265,7 +265,7 @@ python tools/eval.py \
使用文本检测预训练模型在XFUND验证集上评估,达到77%左右,充分说明ppocr提供的预训练模型具有泛化能力。
####
**4.1.2 方案2:XFUND数据集+fine-tune**
####
4.1.2 方案2:XFUND数据集+fine-tune
PaddleOCR提供的蒸馏预训练模型包含了多个模型的参数,我们提取Student模型的参数,在XFUND数据集上进行finetune,可以参考如下代码:
...
...
@@ -316,7 +316,13 @@ CUDA_VISIBLE_DEVICES=0 python tools/train.py \
<center><img
src=
"https://ai-studio-static-online.cdn.bcebos.com/5a75137c5f924dfeb6956b5818812298cc3dc7992ac84954b4175be9adf83c77"
></center>
<center>
图8 文本检测方案2-模型评估
</center>
使用训练好的模型进行评估,更新模型路径
`Global.checkpoints`
。
使用训练好的模型进行评估,更新模型路径
`Global.checkpoints`
。如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div
align=
"left"
>
<img
src=
"https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e"
width =
"150"
height =
"150"
/>
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型评估
```
python
...
...
@@ -412,7 +418,7 @@ use_gpu:是否使用GPU
-
XFUND数据集+fine-tune
-
XFUND数据集+fine-tune+真实通用识别数据
####
**4.2.1 方案1:预训练模型**
####
4.2.1 方案1:预训练模型
**1)下载预训练模型**
...
...
@@ -461,7 +467,7 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
使用文本预训练模型在XFUND验证集上评估,acc达到67%左右,充分说明ppocr提供的预训练模型具有泛化能力。
####
**4.2.2 方案2:XFUND数据集+finetune**
####
4.2.2 方案2:XFUND数据集+finetune
同检测模型,我们提取Student模型的参数,在XFUND数据集上进行finetune,可以参考如下代码:
...
...
@@ -528,7 +534,7 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
使用XFUND数据集+finetune训练,在验证集上评估达到72%左右,说明 finetune会提升垂类场景效果。
####
**4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据**
####
4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据
接着我们在上述
`XFUND数据集+finetune`
实验的基础上,添加真实通用识别数据,进一步提升识别效果。首先准备真实通用识别数据,并上传到AIStudio:
...
...
@@ -873,14 +879,6 @@ with open('output/re/infer_results.txt', 'r', encoding='utf-8') as fin:
workbook.close()
``
`
## 获得模型
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div
align=
"left"
>
<img
src=
"https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e"
width =
"150"
height =
"150"
/>
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型推理
## 更多资源
-
更多深度学习知识、产业案例、面试宝典等,请参考:
[
awesome-DeepLearning
](
https://github.com/paddlepaddle/awesome-DeepLearning
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录