Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleOCR
提交
e91f3703
P
PaddleOCR
项目概览
s920243400
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
e91f3703
编写于
5月 12, 2020
作者:
L
LDOUBLEV
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update readme
上级
561c5446
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
8 addition
and
11 deletion
+8
-11
README.md
README.md
+4
-7
doc/detection.md
doc/detection.md
+4
-4
未找到文件。
README.md
浏览文件 @
e91f3703
...
...
@@ -2,7 +2,6 @@
# 简介
PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别模型/工具库,助力使用者训练出更好的模型,并应用落地。
【这里加上效果图】
## 文档教程
-
[
快速安装
](
./doc/installation.md
)
...
...
@@ -11,7 +10,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别
## 特性:
-
超轻量级模型
-
(检测模型4.1M + 识别模型4.5M = 8.6M)
-
(检测模型4.1M + 识别模型4.5M = 8.6M)
-
支持竖排文字
-
(单模型同时支持横排和竖排文字识别)
-
支持长文本识别
...
...
@@ -21,7 +20,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别
## 文本检测算法:
PaddleOCR
提供
的文本检测算法列表:
PaddleOCR
开源
的文本检测算法列表:
-
[
EAST
](
https://arxiv.org/abs/1704.03155
)
-
[
DB
](
https://arxiv.org/abs/1911.08947
)
-
[
SAST
](
https://arxiv.org/abs/1908.05498
)
...
...
@@ -38,16 +37,14 @@ PaddleOCR文本检测算法的训练与使用请参考[文档](./doc/detection.m
## 文本识别算法:
PaddleOCR
提供
的文本识别算法列表:
PaddleOCR
开源
的文本识别算法列表:
-
(CRNN)[https://arxiv.org/abs/1507.05717]
-
[
Rosetta
](
https://arxiv.org/abs/1910.05085
)
-
[
STAR-Net
](
http://www.bmva.org/bmvc/2016/papers/paper043/index.html
)
-
[
RARE
](
https://arxiv.org/abs/1603.03915v1
)
-
[
SRN
](
(https://arxiv.org/abs/2003.12294
)
)(百度自研)
算法效果:
以下指标是在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上的评测结果的平均。
算法效果如下表所示,精度指标是在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上的评测结果的平均值。
|模型|骨干网络|ACC|
|-|-|-|
...
...
doc/detection.md
浏览文件 @
e91f3703
...
...
@@ -2,7 +2,7 @@
本节以icdar15数据集为例,介绍PaddleOCR中检测模型的使用方式。
##
3.1
数据准备
## 数据准备
icdar2015数据集可以从
[
官网
](
https://rrc.cvc.uab.es/?ch=4&com=downloads
)
下载到,首次下载需注册。
将下载到的数据集解压到工作目录下,假设解压在/PaddleOCR/train_data/ 下。另外,PaddleOCR将零散的标注文件整理成单独的标注文件
...
...
@@ -30,7 +30,7 @@ json.dumps编码前的图像标注信息是包含多个字典的list,字典中
可以按照上述形式构建标注文件。
##
3.2
快速启动训练
## 快速启动训练
首先下载pretrain model,PaddleOCR的检测模型目前支持两种backbone,分别是MobileNetV3、ResNet50_vd,
您可以根据需求使用
[
PaddleClas
](
https://github.com/PaddlePaddle/PaddleClas/tree/master/ppcls/modeling/architectures
)
中的模型更换backbone。
...
...
@@ -55,7 +55,7 @@ python3 tools/train.py -c configs/det/det_db_mv3.yml
python3 tools/train.py -c configs/det/det_db_mv3.yml -o Optimizer.base_lr=0.0001
```
##
3.3
指标评估
## 指标评估
PaddleOCR计算三个OCR检测相关的指标,分别是:Precision、Recall、Hmean。
...
...
@@ -65,7 +65,7 @@ PaddleOCR计算三个OCR检测相关的指标,分别是:Precision、Recall
python3 tools/eval.py -c configs/det/det_db_mv3.yml -o checkpoints="./output/best_accuracy"
```
##
3.4
测试检测效果
## 测试检测效果
测试单张图像的检测效果
```
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录