Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleOCR
提交
3387cd8a
P
PaddleOCR
项目概览
s920243400
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
3387cd8a
编写于
6月 19, 2020
作者:
Y
Yipeng
提交者:
GitHub
6月 19, 2020
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update des.
上级
1931e130
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
4 addition
and
4 deletion
+4
-4
doc/doc_ch/datasets.md
doc/doc_ch/datasets.md
+4
-4
未找到文件。
doc/doc_ch/datasets.md
浏览文件 @
3387cd8a
...
...
@@ -2,7 +2,7 @@
这里整理了常用中文数据集,持续更新中,欢迎各位小伙伴贡献数据集~
-
[
ICDAR2019-LSVT
](
#ICDAR2019-LSVT
)
-
[
ICDAR2017-RCTW-17
](
#ICDAR2017-RCTW-17
)
-
[
中文街景文字识别
](
#
ICDAR2019-LSVT行识别任务
)
-
[
中文街景文字识别
](
#
中文街景文字识别
)
-
[
中文文档文字识别
](
#中文文档文字识别
)
-
[
ICDAR2019-ArT
](
#ICDAR2019-ArT
)
...
...
@@ -26,9 +26,9 @@
-
**下载地址**
:https://rctw.vlrlab.net/dataset/
<a
name=
"中文街景文字识别"
></a>
#### 3、中文街景文字识别
#### 3、中文街景文字识别
-
**数据来源**
:https://aistudio.baidu.com/aistudio/competition/detail/8
-
**数据简介**
:共包括29万张图片,其中21万张图片作为训练集(带标注),8万张作为测试集(无标注)。数据集采自中国街景,并由街景图片中的文字行区域(例如店铺标牌、地标等等)截取出来而形成。所有图像都经过一些预处理,将文字区域利用仿射变化,等比映射为一张高为48像素的图片,如图所示:
-
**数据简介**
:
ICDAR2019-LSVT行识别任务,
共包括29万张图片,其中21万张图片作为训练集(带标注),8万张作为测试集(无标注)。数据集采自中国街景,并由街景图片中的文字行区域(例如店铺标牌、地标等等)截取出来而形成。所有图像都经过一些预处理,将文字区域利用仿射变化,等比映射为一张高为48像素的图片,如图所示:
!
[](
../datasets/ch_street_rec_1.png
)
(a) 标注:魅派集成吊顶
!
[](
../datasets/ch_street_rec_2.png
)
...
...
@@ -53,7 +53,7 @@ https://aistudio.baidu.com/aistudio/datasetdetail/8429
<a
name=
"ICDAR2019-ArT"
></a>
#### 5、ICDAR2019-ArT
-
**数据来源**
:https://ai.baidu.com/broad/introduction?dataset=art
-
**数据简介**
:共包含10,166张图像,训练集5603图,测试集4563图。由Total-Text、SCUT-CTW1500、Baidu Curved Scene Text三部分组成,包含水平、多方向和弯曲等多种形状的文本。
-
**数据简介**
:共包含10,166张图像,训练集5603图,测试集4563图。由Total-Text、SCUT-CTW1500、Baidu Curved Scene Text
(ICDAR2019-LSVT部分弯曲数据)
三部分组成,包含水平、多方向和弯曲等多种形状的文本。
!
[](
../datasets/ArT.jpg
)
-
**下载地址**
:https://ai.baidu.com/broad/download?dataset=art
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录