Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
aae51ea7
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
接近 2 年 前同步成功
通知
116
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
aae51ea7
编写于
6月 06, 2022
作者:
L
lvjian0706
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add_multilingual_text_image_orientation
上级
3bc8e79f
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
6 addition
and
6 deletion
+6
-6
docs/zh_CN/PULC/PULC_text_image_orientation.md
docs/zh_CN/PULC/PULC_text_image_orientation.md
+6
-6
未找到文件。
docs/zh_CN/PULC/PULC_text_image_orientation.md
浏览文件 @
aae51ea7
# PULC含文字
的整图
方向分类模型
# PULC含文字
图像
方向分类模型
## 目录
## 目录
...
@@ -33,9 +33,9 @@
...
@@ -33,9 +33,9 @@
## 1. 模型和应用场景介绍
## 1. 模型和应用场景介绍
该案例提供了用户使用 PaddleClas 的超轻量图像分类方案(PULC,Practical Ultra Lightweight Classification)快速构建轻量级、高精度、可落地的含文字的整图
方向的分类模型。该模型可以广泛应用于金融、政务等行业的旋转图片的OCR处理场景中。
在图片拍摄过程中,有时为了拍摄更清晰,会将拍摄设备进行旋转,导致得到的图片也是不同方向的。此时,标准的OCR流程无法很好地应对这些数据。利用图像分类技术,可以预先判断含文字图像的方向,并将其进行方向调整,从而提高OCR处理的准确性。该案例提供了用户使用 PaddleClas 的超轻量图像分类方案(PULC,Practical Ultra Lightweight Classification)快速构建轻量级、高精度、可落地的含文字图像
方向的分类模型。该模型可以广泛应用于金融、政务等行业的旋转图片的OCR处理场景中。
下表列出了判断含文字
整图
方向分类模型的相关指标,前两行展现了使用 SwinTranformer_tiny 和 MobileNetV3_large_x1_0 作为 backbone 训练得到的模型的相关指标,第三行至第五行依次展现了替换 backbone 为 PPLCNet_x1_0、使用 SSLD 预训练模型、使用 SHAS 超参数搜索策略训练得到的模型的相关指标。
下表列出了判断含文字
图像
方向分类模型的相关指标,前两行展现了使用 SwinTranformer_tiny 和 MobileNetV3_large_x1_0 作为 backbone 训练得到的模型的相关指标,第三行至第五行依次展现了替换 backbone 为 PPLCNet_x1_0、使用 SSLD 预训练模型、使用 SHAS 超参数搜索策略训练得到的模型的相关指标。
| 模型 | 精度(%) | 延时(ms) | 存储(M) | 策略 |
| 模型 | 精度(%) | 延时(ms) | 存储(M) | 策略 |
| ---------------------- | --------- | ---------- | --------- | ------------------------------------- |
| ---------------------- | --------- | ---------- | --------- | ------------------------------------- |
...
@@ -73,7 +73,7 @@
...
@@ -73,7 +73,7 @@
#### 3.2.1 数据集来源
#### 3.2.1 数据集来源
[
第1节
](
#1
)
中提供的模型使用内部数据训练得到,该数据集暂时不方便公开。这里基于
[
ICDAR2019 ArT
](
https://ai.baidu.com/broad/introduction?dataset=art
)
和
[
ICDAR2015
](
https://rrc.cvc.uab.es/?ch=4&com=introduction
)
两个公开数据集构造了一个小规模含文字
整图
方向分类数据集,用于体验本案例。
[
第1节
](
#1
)
中提供的模型使用内部数据训练得到,该数据集暂时不方便公开。这里基于
[
ICDAR2019 ArT
](
https://ai.baidu.com/broad/introduction?dataset=art
)
和
[
ICDAR2015
](
https://rrc.cvc.uab.es/?ch=4&com=introduction
)
两个公开数据集构造了一个小规模含文字
图像
方向分类数据集,用于体验本案例。


...
@@ -97,7 +97,7 @@
...
@@ -97,7 +97,7 @@
cd path_to_PaddleClas
cd path_to_PaddleClas
```
```
进入
`dataset/`
目录,下载并解压含文字
的整图
方向场景的数据。
进入
`dataset/`
目录,下载并解压含文字
图像
方向场景的数据。
```
shell
```
shell
cd
dataset
cd
dataset
...
@@ -324,7 +324,7 @@ wget https://paddleclas.bj.bcebos.com/models/PULC/text_image_orientation_infer.t
...
@@ -324,7 +324,7 @@ wget https://paddleclas.bj.bcebos.com/models/PULC/text_image_orientation_infer.t
cd ../
cd ../
```
```
运行下面的命令,对图像
`./images/PULC/text_image_orientation/img_rot0_demo.png`
进行
整图文字
方向分类。
运行下面的命令,对图像
`./images/PULC/text_image_orientation/img_rot0_demo.png`
进行
含文字图像
方向分类。
```
shell
```
shell
# 使用下面的命令使用 GPU 进行预测
# 使用下面的命令使用 GPU 进行预测
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录