From be1747da49c6645f0894813623ee35470d937769 Mon Sep 17 00:00:00 2001 From: xiangyubo Date: Tue, 14 Jul 2020 10:43:15 +0800 Subject: [PATCH] add Chinese character handwriting dataset --- doc/doc_ch/datasets.md | 7 +++++++ 1 file changed, 7 insertions(+) diff --git a/doc/doc_ch/datasets.md b/doc/doc_ch/datasets.md index 81314a8e..a9779bdd 100644 --- a/doc/doc_ch/datasets.md +++ b/doc/doc_ch/datasets.md @@ -5,6 +5,7 @@ - [中文街景文字识别](#中文街景文字识别) - [中文文档文字识别](#中文文档文字识别) - [ICDAR2019-ArT](#ICDAR2019-ArT) +- [中科院自动化研究所-手写中文数据集](#中科院自动化研究所-手写中文数据集) 除了开源数据,用户还可使用合成工具自行合成,可参考的合成工具包括[text_renderer](https://github.com/Sanster/text_renderer)、[SynthText](https://github.com/ankush-me/SynthText)、[SynthText_Chinese_version](https://github.com/JarveeLee/SynthText_Chinese_version)、[TextRecognitionDataGenerator](https://github.com/Belval/TextRecognitionDataGenerator)等。 @@ -57,6 +58,12 @@ https://aistudio.baidu.com/aistudio/datasetdetail/8429 ![](../datasets/ArT.jpg) - **下载地址**:https://ai.baidu.com/broad/download?dataset=art + +#### 6、中科院自动化研究所-手写中文数据集 +- **数据来源**:http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html +- **数据简介**:包含在线和离线两类手写单字数据,包含GB2312-80中的3755个一级汉字,共由720人手写完成。在线部分(HWDB)总共包含约210万个训练样本,53万个测试样本;离线部分(OLHWDB)总共包含约210万个训练样本,53万个测试样本。 +- **下载地址**:http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html + ## 参考文献 **ICDAR 2019-LSVT Challenge** ``` -- GitLab