From 5a8fed914f96c05f299b46142fed5b76ba6e6db4 Mon Sep 17 00:00:00 2001 From: WenmuZhou <572459439@qq.com> Date: Tue, 26 Apr 2022 21:54:06 +0800 Subject: [PATCH] add dataset --- doc/doc_ch/dataset/ocr_datasets.md | 22 ++++++++++++++++++++++ 1 file changed, 22 insertions(+) create mode 100644 doc/doc_ch/dataset/ocr_datasets.md diff --git a/doc/doc_ch/dataset/ocr_datasets.md b/doc/doc_ch/dataset/ocr_datasets.md new file mode 100644 index 00000000..7fd615b8 --- /dev/null +++ b/doc/doc_ch/dataset/ocr_datasets.md @@ -0,0 +1,22 @@ +## OCR数据集 + +- [1. 文本检测](#1) +- [2. 文本识别](#2) + +这里整理了常用OCR数据集,持续更新中,欢迎各位小伙伴贡献数据集~ + + +#### 1. 文本检测 + +| 数据集名称 |图片下载地址| PPOCR标注下载地址 | +|------------|---|---| +| ICDAR 2015 |https://rrc.cvc.uab.es/?ch=4&com=downloads| [train](https://paddleocr.bj.bcebos.com/dataset/train_icdar2015_label.txt) / [test](https://paddleocr.bj.bcebos.com/dataset/test_icdar2015_label.txt) | +| ctw1500 |https://paddleocr.bj.bcebos.com/dataset/ctw1500.zip| 图片下载地址中已包含 | +| total text |https://paddleocr.bj.bcebos.com/dataset/total_text.tar| 图片下载地址中已包含 | + + +#### 2. 文本识别 + +| 数据集名称 | 图片下载地址 | PPOCR标注下载地址 | +|---|---|---| +| en benchmark(MJ, SJ, IIIT, SVT, IC03, IC13, IC15, SVTP, and CUTE.) | [DTRB](https://github.com/clovaai/deep-text-recognition-benchmark#download-lmdb-dataset-for-traininig-and-evaluation-from-here) | LMDB格式,可直接加载 | -- GitLab