From 8ac3423a1748dc402df8ad12a996f5ee656ddf73 Mon Sep 17 00:00:00 2001 From: WenmuZhou Date: Wed, 9 Dec 2020 17:23:21 +0800 Subject: [PATCH] add east and sast --- doc/doc_ch/tree.md | 20 +++++++++++++++----- doc/doc_en/tree_en.md | 18 +++++++++++++++--- 2 files changed, 30 insertions(+), 8 deletions(-) diff --git a/doc/doc_ch/tree.md b/doc/doc_ch/tree.md index 603991d3..b3132146 100644 --- a/doc/doc_ch/tree.md +++ b/doc/doc_ch/tree.md @@ -117,14 +117,14 @@ PaddleOCR │ │ │ │ ├── augment.py // tia_distort,tia_stretch 和 tia_perspective 的代码 │ │ │ │ ├── warp_mls.py │ │ │ ├── __init__.py -│ │ │ ├── iaa_augment.py // 数据增广操作 -│ │ │ ├── label_ops.py // label 编码操作 +│ │ │ ├── east_process.py // EAST 算法的数据处理步骤 │ │ │ ├── make_border_map.py // 生成边界图 │ │ │ ├── make_shrink_map.py // 生成收缩图 │ │ │ ├── operators.py // 图像基本操作,如读取和归一化 │ │ │ ├── randaugment.py // 随机数据增广操作 │ │ │ ├── random_crop_data.py // 随机裁剪 -│ │ │ └── rec_img_aug.py // 文本识别的数据扩充 +│ │ │ ├── rec_img_aug.py // 文本识别的数据扩充 +│ │ │ └── sast_process.py // SAST 算法的数据处理步骤 │ │ ├── __init__.py // 构造 dataloader 相关代码 │ │ ├── lmdb_dataset.py // 读取lmdb数据集的 dataset │ │ ├── simple_dataset.py // 读取文本格式存储数据集的 dataset @@ -133,6 +133,8 @@ PaddleOCR │ │ ├── cls_loss.py // 方向分类器 loss │ │ ├── det_basic_loss.py // 检测基础 loss │ │ ├── det_db_loss.py // DB loss +│ │ ├── det_east_loss.py // EAST loss +│ │ ├── det_sast_loss.py // SAST loss │ │ ├── rec_ctc_loss.py // ctc loss │ ├── metrics // 评估指标 │ │ ├── __init__.py // 构造 metric 相关代码 @@ -148,16 +150,21 @@ PaddleOCR │ │ │ ├── __init__.py // 构造 backbone 相关代码 │ │ │ ├── det_mobilenet_v3.py // 检测 mobilenet_v3 │ │ │ ├── det_resnet_vd.py // 检测 resnet +│ │ │ ├── det_resnet_vd_sast.py // 检测 SAST算法的resnet backbone │ │ │ ├── rec_mobilenet_v3.py // 识别 mobilenet_v3 │ │ │ └── rec_resnet_vd.py // 识别 resnet │ │ ├── necks // 颈函数 │ │ │ ├── __init__.py // 构造 neck 相关代码 -│ │ │ ├── db_fpn.py // fpn 网络 +│ │ │ ├── db_fpn.py // 标准 fpn 网络 +│ │ │ ├── east_fpn.py // EAST 算法的 fpn 网络 +│ │ │ ├── sast_fpn.py // SAST 算法的 fpn 网络 │ │ │ ├── rnn.py // 识别 序列编码 │ │ ├── heads // 头函数 │ │ │ ├── __init__.py // 构造 head 相关代码 │ │ │ ├── cls_head.py // 方向分类器 分类头 │ │ │ ├── det_db_head.py // db 检测头 +│ │ │ ├── det_east_head.py // EAST 检测头 +│ │ │ ├── det_sast_head.py // SAST 检测头 │ │ │ ├── rec_ctc_head.py // 识别 ctc │ │ ├── transforms // 图像变换 │ │ │ ├── __init__.py // 构造 transform 相关代码 @@ -170,7 +177,10 @@ PaddleOCR │ ├── postprocess // 后处理 │ │ ├── cls_postprocess.py // 方向分类器 后处理 │ │ ├── db_postprocess.py // DB 后处理 -│ │ └── rec_postprocess.py // 识别网络 后处理 +│ │ ├── east_postprocess.py // EAST 后处理 +│ │ ├── locality_aware_nms.py // NMS +│ │ ├── rec_postprocess.py // 识别网络 后处理 +│ │ └── sast_postprocess.py // SAST 后处理 │ └── utils // 工具 │ ├── dict // 小语种字典 │ .... diff --git a/doc/doc_en/tree_en.md b/doc/doc_en/tree_en.md index 1c32c92c..461bb184 100644 --- a/doc/doc_en/tree_en.md +++ b/doc/doc_en/tree_en.md @@ -118,6 +118,7 @@ PaddleOCR │ │ │ │ ├── augment.py // Tia_distort,tia_stretch and tia_perspective │ │ │ │ ├── warp_mls.py │ │ │ ├── __init__.py +│ │ │ ├── east_process.py // Data processing steps of EAST algorithm │ │ │ ├── iaa_augment.py // Data augmentation operations │ │ │ ├── label_ops.py // label encode operations │ │ │ ├── make_border_map.py // Generate boundary map @@ -125,7 +126,8 @@ PaddleOCR │ │ │ ├── operators.py // Basic image operations, such as reading and normalization │ │ │ ├── randaugment.py // Random data augmentation operation │ │ │ ├── random_crop_data.py // Random crop -│ │ │ └── rec_img_aug.py // Data augmentation for text recognition +│ │ │ ├── rec_img_aug.py // Data augmentation for text recognition +│ │ │ └── sast_process.py // Data processing steps of SAST algorithm │ │ ├── __init__.py // Construct dataloader code │ │ ├── lmdb_dataset.py // Read lmdb dataset │ │ ├── simple_dataset.py // Read the dataset stored in text format @@ -134,6 +136,8 @@ PaddleOCR │ │ ├── cls_loss.py // Angle class loss │ │ ├── det_basic_loss.py // Text detection basic loss │ │ ├── det_db_loss.py // DB loss +│ │ ├── det_east_loss.py // EAST loss +│ │ ├── det_sast_loss.py // SAST loss │ │ ├── rec_ctc_loss.py // ctc loss │ ├── metrics // Metrics │ │ ├── __init__.py // Construct metric code @@ -149,16 +153,21 @@ PaddleOCR │ │ │ ├── __init__.py // Construct backbone code │ │ │ ├── det_mobilenet_v3.py // Text detection mobilenet_v3 │ │ │ ├── det_resnet_vd.py // Text detection resnet +│ │ │ ├── det_resnet_vd_sast.py // Text detection resnet backbone of the SAST algorithm │ │ │ ├── rec_mobilenet_v3.py // Text recognition mobilenet_v3 │ │ │ └── rec_resnet_vd.py // Text recognition resnet │ │ ├── necks // Necks │ │ │ ├── __init__.py // Construct neck code -│ │ │ ├── db_fpn.py // FPN +│ │ │ ├── db_fpn.py // Standard fpn +│ │ │ ├── east_fpn.py // EAST algorithm fpn network +│ │ │ ├── sast_fpn.py // SAST algorithm fpn network │ │ │ ├── rnn.py // Character recognition sequence encoding │ │ ├── heads // Heads │ │ │ ├── __init__.py // Construct head code │ │ │ ├── cls_head.py // Angle class head │ │ │ ├── det_db_head.py // DB head +│ │ │ ├── det_east_head.py // EAST head +│ │ │ ├── det_sast_head.py // SAST head │ │ │ ├── rec_ctc_head.py // Ctc head │ │ ├── transforms // Transforms │ │ │ ├── __init__.py // Construct transform code @@ -171,7 +180,10 @@ PaddleOCR │ ├── postprocess // Post-processing │ │ ├── cls_postprocess.py // Angle class post-processing │ │ ├── db_postprocess.py // DB post-processing -│ │ └── rec_postprocess.py // Text recognition post-processing +│ │ ├── east_postprocess.py // EAST post-processing +│ │ ├── locality_aware_nms.py // NMS +│ │ ├── rec_postprocess.py // Text recognition post-processing +│ │ └── sast_postprocess.py // SAST post-processing │ └── utils // utils │ ├── dict // Minor language dictionary │ .... -- GitLab