diff --git a/doc/datasets/captcha_demo.png b/doc/datasets/captcha_demo.png
new file mode 100644
index 0000000000000000000000000000000000000000..047a72648c5766102fbfb9301a9c19917fe62b04
Binary files /dev/null and b/doc/datasets/captcha_demo.png differ
diff --git a/doc/datasets/ccpd_demo.png b/doc/datasets/ccpd_demo.png
new file mode 100644
index 0000000000000000000000000000000000000000..a750d054f6d05ece9021261e2dba94616da940fe
Binary files /dev/null and b/doc/datasets/ccpd_demo.png differ
diff --git a/doc/datasets/cmb_demo.jpg b/doc/datasets/cmb_demo.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..8299149a7c20041e4db7b75b751b705581106929
Binary files /dev/null and b/doc/datasets/cmb_demo.jpg differ
diff --git a/doc/datasets/nist_demo.png b/doc/datasets/nist_demo.png
new file mode 100644
index 0000000000000000000000000000000000000000..4c2ce11e2648b170d8342fb739a0d014079c50e4
Binary files /dev/null and b/doc/datasets/nist_demo.png differ
diff --git a/doc/doc_ch/handwritten_datasets.md b/doc/doc_ch/handwritten_datasets.md
index 21f68acc1a1974b26fce6778b0d87781207b53da..46e85e4f9dc22e4732f654f9a1ef2a715a498fcf 100644
--- a/doc/doc_ch/handwritten_datasets.md
+++ b/doc/doc_ch/handwritten_datasets.md
@@ -1,13 +1,28 @@
-## 手写中文OCR数据集
-这里整理了常用手写中文数据集，持续更新中，欢迎各位小伙伴贡献数据集～
+# 手写OCR数据集
+这里整理了常用手写数据集，持续更新中，欢迎各位小伙伴贡献数据集～
 - [中科院自动化研究所-手写中文数据集](#中科院自动化研究所-手写中文数据集)
+- [NIST手写单字数据集-英文](#NIST手写单字数据集-英文)
 
 <a name="中科院自动化研究所-手写中文数据集"></a>
-#### 1、中科院自动化研究所-手写中文数据集
+## 中科院自动化研究所-手写中文数据集
 - **数据来源**：http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html
-- **数据简介**：包含在线和离线两类手写单字数据，包含GB2312-80中的3755个一级汉字，共由720人手写完成。在线部分(HWDB)总共包含约210万个训练样本，53万个测试样本；离线部分(OLHWDB)总共包含约210万个训练样本，53万个测试样本。
-    ![](../datasets/CASIA_0.jpg)  
-    (a) 五张单字图片样例  
+- **数据简介**：
+    * 包含在线和离线两类手写数据，`HWDB1.0~1.2`总共有3895135个手写单字样本，分属7356类（7185个汉字和171个英文字母、数字、符号）；`HWDB2.0~2.2`总共有5091页图像，分割为52230个文本行和1349414个文字。所有文字和文本样本均存为灰度图像。部分单字样本图片如下所示。
+
+        ![](../datasets/CASIA_0.jpg)
+
 - **下载地址**：http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html
 - **使用建议**：数据为单字，白色背景，可以大量合成文字行进行训练。白色背景可以处理成透明状态，方便添加各种背景。对于需要语义的情况，建议从真实语料出发，抽取单字组成文字行
 
+
+<a name="NIST手写单字数据集-英文"></a>
+## NIST手写单字数据集-英文(NIST Handprinted Forms and Characters Database)
+
+- **数据来源**: [https://www.nist.gov/srd/nist-special-database-19](https://www.nist.gov/srd/nist-special-database-19)
+
+- **数据简介**: NIST19数据集适用于手写文档和字符识别的模型训练，从3600位作者的手写样本表格中提取得到，总共包含81万张字符图片。其中9张图片示例如下。
+
+    ![](../datasets/nist_demo.png)
+
+
+- **下载地址**: [https://www.nist.gov/srd/nist-special-database-19](https://www.nist.gov/srd/nist-special-database-19)
diff --git a/doc/doc_ch/vertical_and_multilingual_datasets.md b/doc/doc_ch/vertical_and_multilingual_datasets.md
new file mode 100644
index 0000000000000000000000000000000000000000..802ade5f8eb3b0d3cc8335034a8fda8821464a8b
--- /dev/null
+++ b/doc/doc_ch/vertical_and_multilingual_datasets.md
@@ -0,0 +1,79 @@
+# 垂类多语言OCR数据集
+这里整理了常用垂类和多语言OCR数据集，持续更新中，欢迎各位小伙伴贡献数据集～
+- [中国城市车牌数据集](#中国城市车牌数据集)
+- [银行信用卡数据集](#银行信用卡数据集)
+- [验证码数据集-Captcha](#验证码数据集-Captcha)
+- [多语言数据集](#多语言数据集)
+
+
+<a name="中国城市车牌数据集"></a>
+## 中国城市车牌数据集
+
+- **数据来源**：[https://github.com/detectRecog/CCPD](https://github.com/detectRecog/CCPD)
+
+- **数据简介**: 包含超过25万张中国城市车牌图片及车牌检测、识别信息的标注。包含以下几种不同场景中的车牌图片信息。
+    * CCPD-Base: 通用车牌图片
+    * CCPD-DB: 车牌区域亮度较亮、较暗或者不均匀
+    * CCPD-FN: 车牌离摄像头拍摄位置相对更远或者更近
+    * CCPD-Rotate: 车牌包含旋转（水平20\~50度，竖直-10\~10度）
+    * CCPD-Tilt: 车牌包含旋转（水平15\~45度，竖直15\~45度）
+    * CCPD-Blur: 车牌包含由于摄像机镜头抖动导致的模糊情况
+    * CCPD-Weather: 车牌在雨天、雪天或者雾天拍摄得到
+    * CCPD-Challenge: 至今在车牌检测识别任务中最有挑战性的一些图片
+    * CCPD-NP: 没有安装车牌的新车图片。
+
+    ![](../datasets/ccpd_demo.png)
+
+
+- **下载地址**
+    * 百度云下载地址(提取码是hm0U): [https://pan.baidu.com/s/1i5AOjAbtkwb17Zy-NQGqkw](https://pan.baidu.com/s/1i5AOjAbtkwb17Zy-NQGqkw)
+    * Google drive下载地址：[https://drive.google.com/file/d/1rdEsCUcIUaYOVRkx5IMTRNA7PcGMmSgc/view](https://drive.google.com/file/d/1rdEsCUcIUaYOVRkx5IMTRNA7PcGMmSgc/view)
+
+
+<a name="银行信用卡数据集"></a>
+## 银行信用卡数据集
+
+- **数据来源**: [https://www.kesci.com/home/dataset/5954cf1372ead054a5e25870](https://www.kesci.com/home/dataset/5954cf1372ead054a5e25870)
+
+- **数据简介**: 训练数据共提供了三类数据
+    * 1.招行样卡数据： 包括卡面图片数据及标注数据，总共618张图片
+    * 2.单字符数据： 包括图片及标注数据，总共37张图片。
+    * 3.仅包含其他银行卡面，不具有更细致的信息，总共50张图片。
+
+    * demo图片展示如下，标注信息存储在excel表格中，下面的demo图片标注为
+        * 前8位卡号：62257583
+        * 卡片种类：本行卡
+        * 有效期结束：07/41
+        * 卡用户拼音：MICHAEL
+
+    ![](../datasets/cmb_demo.jpg)
+
+- **下载地址**: [https://cdn.kesci.com/cmb2017-2.zip](https://cdn.kesci.com/cmb2017-2.zip)
+
+
+
+<a name="验证码数据集-Captcha"></a>
+## 验证码数据集-Captcha
+
+- **数据来源**: [https://github.com/lepture/captcha](https://github.com/lepture/captcha)
+
+- **数据简介**: 这是一个数据合成的工具包，可以根据输入的文本，输出验证码图片，使用该工具包生成几张demo图片如下。
+
+    ![](../datasets/captcha_demo.png)
+
+- **下载地址**: 该数据集是生成得到，无下载地址。
+
+
+
+<a name="多语言数据集"></a>
+## 多语言数据集(Multi-lingual scene text detection and recognition)
+
+- **数据来源**: [https://rrc.cvc.uab.es/?ch=15&com=downloads](https://rrc.cvc.uab.es/?ch=15&com=downloads)
+
+- **数据简介**: 多语言检测数据集MLT同时包含了语种识别和检测任务。
+    * 在检测任务中，训练集包含10000张图片，共有10种语言，每种语言包含1000张训练图片。测试集包含10000张图片。
+    * 在识别任务中，训练集包含111998个样本。
+
+
+- **下载地址**: 训练集较大，分2部分下载，需要在网站上注册之后才能下载：
+[https://rrc.cvc.uab.es/?ch=15&com=downloads](https://rrc.cvc.uab.es/?ch=15&com=downloads)