From 3387cd8ae4bc434fa8e762b90b2f48b1fb078c7e Mon Sep 17 00:00:00 2001 From: Yipeng <16645362+Yipeng-Sun@users.noreply.github.com> Date: Fri, 19 Jun 2020 22:34:07 +0800 Subject: [PATCH] update des. --- doc/doc_ch/datasets.md | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/doc/doc_ch/datasets.md b/doc/doc_ch/datasets.md index e41e79af..ee13ef94 100644 --- a/doc/doc_ch/datasets.md +++ b/doc/doc_ch/datasets.md @@ -2,7 +2,7 @@ 这里整理了常用中文数据集,持续更新中,欢迎各位小伙伴贡献数据集~ - [ICDAR2019-LSVT](#ICDAR2019-LSVT) - [ICDAR2017-RCTW-17](#ICDAR2017-RCTW-17) -- [中文街景文字识别](#ICDAR2019-LSVT行识别任务) +- [中文街景文字识别](#中文街景文字识别) - [中文文档文字识别](#中文文档文字识别) - [ICDAR2019-ArT](#ICDAR2019-ArT) @@ -26,9 +26,9 @@ - **下载地址**:https://rctw.vlrlab.net/dataset/ -#### 3、中文街景文字识别 +#### 3、中文街景文字识别 - **数据来源**:https://aistudio.baidu.com/aistudio/competition/detail/8 -- **数据简介**:共包括29万张图片,其中21万张图片作为训练集(带标注),8万张作为测试集(无标注)。数据集采自中国街景,并由街景图片中的文字行区域(例如店铺标牌、地标等等)截取出来而形成。所有图像都经过一些预处理,将文字区域利用仿射变化,等比映射为一张高为48像素的图片,如图所示: +- **数据简介**:ICDAR2019-LSVT行识别任务,共包括29万张图片,其中21万张图片作为训练集(带标注),8万张作为测试集(无标注)。数据集采自中国街景,并由街景图片中的文字行区域(例如店铺标牌、地标等等)截取出来而形成。所有图像都经过一些预处理,将文字区域利用仿射变化,等比映射为一张高为48像素的图片,如图所示: ![](../datasets/ch_street_rec_1.png) (a) 标注:魅派集成吊顶 ![](../datasets/ch_street_rec_2.png) @@ -53,7 +53,7 @@ https://aistudio.baidu.com/aistudio/datasetdetail/8429 #### 5、ICDAR2019-ArT - **数据来源**:https://ai.baidu.com/broad/introduction?dataset=art -- **数据简介**:共包含10,166张图像,训练集5603图,测试集4563图。由Total-Text、SCUT-CTW1500、Baidu Curved Scene Text三部分组成,包含水平、多方向和弯曲等多种形状的文本。 +- **数据简介**:共包含10,166张图像,训练集5603图,测试集4563图。由Total-Text、SCUT-CTW1500、Baidu Curved Scene Text (ICDAR2019-LSVT部分弯曲数据) 三部分组成,包含水平、多方向和弯曲等多种形状的文本。 ![](../datasets/ArT.jpg) - **下载地址**:https://ai.baidu.com/broad/download?dataset=art -- GitLab