提交 46fafa29 编写于 作者: A an1018

update

上级 d554037e
......@@ -206,7 +206,11 @@ Eval.dataset.transforms.DetResizeForTest: 尺寸
limit_type: 'min'
```
然后执行评估代码
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型评估。
```python
......
......@@ -7,12 +7,12 @@
- [3.2 转换为PaddleOCR检测和识别格式](#32-转换为paddleocr检测和识别格式)
- [4 OCR](#4-ocr)
- [4.1 文本检测](#41-文本检测)
- [**4.1.1 方案1:预训练模型**](#411-方案1预训练模型)
- [**4.1.2 方案2:XFUND数据集+fine-tune**](#412-方案2xfund数据集fine-tune)
- [4.1.1 方案1:预训练模型](#411-方案1预训练模型)
- [4.1.2 方案2:XFUND数据集+fine-tune](#412-方案2xfund数据集fine-tune)
- [4.2 文本识别](#42-文本识别)
- [**4.2.1 方案1:预训练模型**](#421-方案1预训练模型)
- [**4.2.2 方案2:XFUND数据集+finetune**](#422-方案2xfund数据集finetune)
- [**4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据**](#423-方案3xfund数据集finetune真实通用识别数据)
- [4.2.1 方案1:预训练模型](#421-方案1预训练模型)
- [4.2.2 方案2:XFUND数据集+finetune](#422-方案2xfund数据集finetune)
- [4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据](#423-方案3xfund数据集finetune真实通用识别数据)
- [5 文档视觉问答(DOC-VQA)](#5-文档视觉问答doc-vqa)
- [5.1 SER](#51-ser)
- [5.1.1 模型训练](#511-模型训练)
......@@ -195,7 +195,7 @@ python trans_xfund_data.py
- **PP-OCRv2中英文超轻量检测预训练模型**
- **XFUND数据集+fine-tune**
#### **4.1.1 方案1:预训练模型**
#### 4.1.1 方案1:预训练模型
**1)下载预训练模型**
......@@ -265,7 +265,7 @@ python tools/eval.py \
使用文本检测预训练模型在XFUND验证集上评估,达到77%左右,充分说明ppocr提供的预训练模型具有泛化能力。
#### **4.1.2 方案2:XFUND数据集+fine-tune**
#### 4.1.2 方案2:XFUND数据集+fine-tune
PaddleOCR提供的蒸馏预训练模型包含了多个模型的参数,我们提取Student模型的参数,在XFUND数据集上进行finetune,可以参考如下代码:
......@@ -316,7 +316,13 @@ CUDA_VISIBLE_DEVICES=0 python tools/train.py \
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/5a75137c5f924dfeb6956b5818812298cc3dc7992ac84954b4175be9adf83c77"></center>
<center>图8 文本检测方案2-模型评估</center>
使用训练好的模型进行评估,更新模型路径`Global.checkpoints`
使用训练好的模型进行评估,更新模型路径`Global.checkpoints`。如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型评估
```python
......@@ -412,7 +418,7 @@ use_gpu:是否使用GPU
- XFUND数据集+fine-tune
- XFUND数据集+fine-tune+真实通用识别数据
#### **4.2.1 方案1:预训练模型**
#### 4.2.1 方案1:预训练模型
**1)下载预训练模型**
......@@ -461,7 +467,7 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
使用文本预训练模型在XFUND验证集上评估,acc达到67%左右,充分说明ppocr提供的预训练模型具有泛化能力。
#### **4.2.2 方案2:XFUND数据集+finetune**
#### 4.2.2 方案2:XFUND数据集+finetune
同检测模型,我们提取Student模型的参数,在XFUND数据集上进行finetune,可以参考如下代码:
......@@ -528,7 +534,7 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
使用XFUND数据集+finetune训练,在验证集上评估达到72%左右,说明 finetune会提升垂类场景效果。
#### **4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据**
#### 4.2.3 方案3:XFUND数据集+finetune+真实通用识别数据
接着我们在上述`XFUND数据集+finetune`实验的基础上,添加真实通用识别数据,进一步提升识别效果。首先准备真实通用识别数据,并上传到AIStudio:
......@@ -873,14 +879,6 @@ with open('output/re/infer_results.txt', 'r', encoding='utf-8') as fin:
workbook.close()
```
## 获得模型
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型推理
## 更多资源
- 更多深度学习知识、产业案例、面试宝典等,请参考:[awesome-DeepLearning](https://github.com/paddlepaddle/awesome-DeepLearning)
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册