Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleOCR
提交
dc7bd04e
P
PaddleOCR
项目概览
s920243400
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
dc7bd04e
编写于
6月 08, 2020
作者:
D
dyning
提交者:
GitHub
6月 08, 2020
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #147 from MissPenguin/develop
add datasets & FAQ doc
上级
3b9e3579
16263e76
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
13 addition
and
13 deletion
+13
-13
README.md
README.md
+1
-1
doc/FAQ.md
doc/FAQ.md
+2
-1
doc/datasets.md
doc/datasets.md
+10
-11
未找到文件。
README.md
浏览文件 @
dc7bd04e
...
...
@@ -2,11 +2,11 @@
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
**近期更新**
-
2020.6.8 添加
[
数据集
](
./doc/datasets.md
)
,并保持持续更新
-
2020.6.5 支持
`attetnion`
模型导出
`inference_model`
-
2020.6.5 支持单独预测识别时,输出结果得分
-
2020.5.30 提供超轻量级中文OCR在线体验
-
2020.5.30 模型预测、训练支持Windows系统
-
2020.5.30 开源通用中文OCR模型
-
[
more
](
./doc/update.md
)
## 特性
...
...
doc/FAQ.md
浏览文件 @
dc7bd04e
...
...
@@ -21,7 +21,8 @@ PaddleOCR已完成Windows和Mac系统适配,运行时注意两点:1、在[
7.
**超轻量模型和通用OCR模型的区别**
目前PaddleOCR开源了2个中文模型,分别是8.6M超轻量中文模型和通用中文OCR模型。两者对比信息如下:
-
相同点:两者使用相同的
**算法**
和
**训练数据**
;
-
不同点:不同之处在于
**骨干网络**
和
**通道参数**
,超轻量模型使用MobileNetV3作为骨干网络,通用模型使用Resnet50_vd作为检测模型backbone,Resnet34_vd作为识别模型backbone,具体参数差异可对比两种模型训练的配置文件。
-
不同点:不同之处在于
**骨干网络**
和
**通道参数**
,超轻量模型使用MobileNetV3作为骨干网络,通用模型使用Resnet50_vd作为检测模型backbone,Resnet34_vd作为识别模型backbone,具体参数差异可对比两种模型训练的配置文件.
|模型|骨干网络|检测训练配置|识别训练配置|
|-|-|-|-|
|8.6M超轻量中文OCR模型|MobileNetV3+MobileNetV3|det_mv3_db.yml|rec_chinese_lite_train.yml|
...
...
doc/datasets.md
浏览文件 @
dc7bd04e
...
...
@@ -29,26 +29,25 @@
#### 3、中文街景文字识别
-
**数据来源**
:https://aistudio.baidu.com/aistudio/competition/detail/8
-
**数据简介**
:共包括29万张图片,其中21万张图片作为训练集(带标注),8万张作为测试集(无标注)。数据集采自中国街景,并由街景图片中的文字行区域(例如店铺标牌、地标等等)截取出来而形成。所有图像都经过一些预处理,将文字区域利用仿射变化,等比映射为一张高为48像素的图片,如图所示:
!
[](
datasets/ch_street_rec_1.png
)
(a) 标注:魅派集成吊顶
!
[](
datasets/ch_street_rec_2.png
)
(b) 标注:母婴用品连锁
!
[](
datasets/ch_street_rec_1.png
)
(a) 标注:魅派集成吊顶
!
[](
datasets/ch_street_rec_2.png
)
(b) 标注:母婴用品连锁
-
**下载地址**
https://aistudio.baidu.com/aistudio/datasetdetail/8429
<a
name=
"中文文档文字识别"
></a>
#### 4、中文文档文字识别
-
**数据来源**
:https://github.com/YCG09/chinese_ocr
-
**数据简介**
:
-
**数据来源**
:https://github.com/YCG09/chinese_ocr
-
**数据简介**
:
-
共约364万张图片,按照99:1划分成训练集和验证集。
-
数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
-
包含汉字、英文字母、数字和标点共5990个字符(字符集合:https://github.com/YCG09/chinese_ocr/blob/master/train/char_std_5990.txt )
-
每个样本固定10个字符,字符随机截取自语料库中的句子
-
图片分辨率统一为280x32
!
[](
datasets/ch_doc1.jpg
)
!
[](
datasets/ch_doc2.jpg
)
!
[](
datasets/ch_doc3.jpg
)
-
图片分辨率统一为280x32
!
[](
datasets/ch_doc1.jpg
)
!
[](
datasets/ch_doc2.jpg
)
!
[](
datasets/ch_doc3.jpg
)
-
**下载地址**
:https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码:lu7m)
<a
name=
"ICDAR2019-ArT"
></a>
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录