tree.md 13.5 KB
Newer Older
W
WenmuZhou 已提交
1 2 3 4 5 6
# 整体目录结构

PaddleOCR 的整体目录结构介绍如下:

```
PaddleOCR
W
WenmuZhou 已提交
7 8 9 10 11
├── configs                                 // 配置文件,可通过 yml 文件选择模型结构并修改超参
│   ├── cls                                 // 方向分类器相关配置文件
│   │   ├── cls_mv3.yml                     // 训练配置相关,包括骨干网络、head、loss、优化器和数据
│   ├── det                                 // 检测相关配置文件
│   │   ├── det_mv3_db.yml                  // 训练配置
W
WenmuZhou 已提交
12
│   │   ...  
W
WenmuZhou 已提交
13 14
│   └── rec                                 // 识别相关配置文件
│       ├── rec_mv3_none_bilstm_ctc.yml     // crnn 训练配置
W
WenmuZhou 已提交
15
│       ...  
W
WenmuZhou 已提交
16 17
├── deploy                                  // 部署相关
│   ├── android_demo                        // android_demo
W
WenmuZhou 已提交
18
│   │   ...
W
WenmuZhou 已提交
19 20 21
│   ├── cpp_infer                           // C++ infer
│   │   ├── CMakeLists.txt                  // Cmake 文件
│   │   ├── docs                            // 说明文档
W
WenmuZhou 已提交
22
│   │   │   └── windows_vs2019_build.md
W
WenmuZhou 已提交
23 24 25 26 27 28 29 30 31 32
│   │   ├── include                         // 头文件
│   │   │   ├── clipper.h                   // clipper 库
│   │   │   ├── config.h                    // 预测配置
│   │   │   ├── ocr_cls.h                   // 方向分类器
│   │   │   ├── ocr_det.h                   // 文字检测
│   │   │   ├── ocr_rec.h                   // 文字识别
│   │   │   ├── postprocess_op.h            // 检测后处理
│   │   │   ├── preprocess_op.h             // 检测预处理
│   │   │   └── utility.h                   // 工具
│   │   ├── readme.md                       // 说明文档
W
WenmuZhou 已提交
33
│   │   ├── ...
W
WenmuZhou 已提交
34
│   │   ├── src                             // 源文件
W
WenmuZhou 已提交
35 36 37 38 39 40 41 42 43
│   │   │   ├── clipper.cpp  
│   │   │   ├── config.cpp
│   │   │   ├── main.cpp
│   │   │   ├── ocr_cls.cpp
│   │   │   ├── ocr_det.cpp
│   │   │   ├── ocr_rec.cpp
│   │   │   ├── postprocess_op.cpp
│   │   │   ├── preprocess_op.cpp
│   │   │   └── utility.cpp
W
WenmuZhou 已提交
44 45 46 47
│   │   └── tools                           // 编译、执行脚本
│   │       ├── build.sh                    // 编译脚本
│   │       ├── config.txt                  // 配置文件
│   │       └── run.sh                      // 测试启动脚本
W
WenmuZhou 已提交
48 49 50 51 52 53 54 55 56
│   ├── docker
│   │   └── hubserving
│   │       ├── cpu
│   │       │   └── Dockerfile
│   │       ├── gpu
│   │       │   └── Dockerfile
│   │       ├── README_cn.md
│   │       ├── README.md
│   │       └── sample_request.txt
W
WenmuZhou 已提交
57 58 59
│   ├── hubserving                          // hubserving
│   │   ├── ocr_cls                         // 方向分类器
│   │   │   ├── config.json                 // serving 配置
W
WenmuZhou 已提交
60
│   │   │   ├── __init__.py  
W
WenmuZhou 已提交
61 62 63 64 65 66 67 68
│   │   │   ├── module.py                   // 预测模型
│   │   │   └── params.py                   // 预测参数
│   │   ├── ocr_det                         // 文字检测
│   │   │   ├── config.json                 // serving 配置
│   │   │   ├── __init__.py  
│   │   │   ├── module.py                   // 预测模型
│   │   │   └── params.py                   // 预测参数
│   │   ├── ocr_rec                         // 文字识别
W
WenmuZhou 已提交
69 70 71 72
│   │   │   ├── config.json
│   │   │   ├── __init__.py
│   │   │   ├── module.py
│   │   │   └── params.py
W
WenmuZhou 已提交
73
│   │   └── ocr_system                      // 系统预测
W
WenmuZhou 已提交
74 75 76 77
│   │       ├── config.json
│   │       ├── __init__.py
│   │       ├── module.py
│   │       └── params.py
W
WenmuZhou 已提交
78
│   ├── imgs                                // 预测图片
W
WenmuZhou 已提交
79 80
│   │   ├── cpp_infer_pred_12.png
│   │   └── demo.png
W
WenmuZhou 已提交
81
│   ├── ios_demo                            // ios demo
W
WenmuZhou 已提交
82
│   │   ...
W
WenmuZhou 已提交
83 84
│   ├── lite                                // lite 部署
│   │   ├── cls_process.cc                  // 方向分类器数据处理
W
WenmuZhou 已提交
85
│   │   ├── cls_process.h
W
WenmuZhou 已提交
86 87
│   │   ├── config.txt                      // 检测配置参数
│   │   ├── crnn_process.cc                 // crnn 数据处理
W
WenmuZhou 已提交
88
│   │   ├── crnn_process.h
W
WenmuZhou 已提交
89
│   │   ├── db_post_process.cc              // db 数据处理
W
WenmuZhou 已提交
90
│   │   ├── db_post_process.h
W
WenmuZhou 已提交
91 92 93 94
│   │   ├── Makefile                        // 编译文件
│   │   ├── ocr_db_crnn.cc                  // 串联预测
│   │   ├── prepare.sh                      // 数据准备
│   │   ├── readme.md                       // 说明文档
W
WenmuZhou 已提交
95
│   │   ...
W
WenmuZhou 已提交
96 97 98 99 100 101 102 103 104
│   ├── pdserving                           // pdserving 部署
│   │   ├── det_local_server.py             // 检测 快速版,部署方便预测速度快
│   │   ├── det_web_server.py               // 检测 完整版,稳定性高分布式部署
│   │   ├── ocr_local_server.py             // 检测+识别 快速版
│   │   ├── ocr_web_client.py               // 客户端
│   │   ├── ocr_web_server.py               // 检测+识别 完整版
│   │   ├── readme.md                       // 说明文档
│   │   ├── rec_local_server.py             // 识别 快速版
│   │   └── rec_web_server.py               // 识别 完整版
W
WenmuZhou 已提交
105
│   └── slim  
W
WenmuZhou 已提交
106 107 108 109 110
│       └── quantization                    // 量化相关
│           ├── export_model.py             // 导出模型
│           ├── quant.py                    // 量化
│           └── README.md                   // 说明文档
├── doc                                     // 文档教程
W
WenmuZhou 已提交
111
│   ...
W
WenmuZhou 已提交
112 113 114 115 116 117 118 119
├── ppocr                                   // 网络核心代码
│   ├── data                                // 数据处理
│   │   ├── imaug                           // 图片和 label 处理代码
│   │   │   ├── text_image_aug              // 文本识别的 tia 数据扩充
│   │   │   │   ├── __init__.py
│   │   │   │   ├── augment.py              // tia_distort,tia_stretch 和 tia_perspective 的代码
│   │   │   │   ├── warp_mls.py 
│   │   │   ├── __init__.py
W
WenmuZhou 已提交
120
│   │   │   ├── east_process.py             // EAST 算法的数据处理步骤
W
WenmuZhou 已提交
121 122 123 124 125
│   │   │   ├── make_border_map.py          // 生成边界图
│   │   │   ├── make_shrink_map.py          // 生成收缩图
│   │   │   ├── operators.py                // 图像基本操作,如读取和归一化
│   │   │   ├── randaugment.py              // 随机数据增广操作
│   │   │   ├── random_crop_data.py         // 随机裁剪
W
WenmuZhou 已提交
126 127
│   │   │   ├── rec_img_aug.py              // 文本识别的数据扩充
│   │   │   └── sast_process.py             // SAST 算法的数据处理步骤
W
WenmuZhou 已提交
128 129 130 131 132 133 134 135
│   │   ├── __init__.py                     // 构造 dataloader 相关代码
│   │   ├── lmdb_dataset.py                 // 读取lmdb数据集的 dataset
│   │   ├── simple_dataset.py               // 读取文本格式存储数据集的 dataset
│   ├── losses                              // 损失函数
│   │   ├── __init__.py                     // 构造 loss 相关代码
│   │   ├── cls_loss.py                     // 方向分类器 loss
│   │   ├── det_basic_loss.py               // 检测基础 loss
│   │   ├── det_db_loss.py                  // DB loss
W
WenmuZhou 已提交
136 137
│   │   ├── det_east_loss.py                // EAST loss
│   │   ├── det_sast_loss.py                // SAST loss
W
WenmuZhou 已提交
138 139
│   │   ├── rec_ctc_loss.py                 // CTC loss
│   │   ├── rec_att_loss.py                 // Attention loss
W
WenmuZhou 已提交
140 141 142 143 144 145 146 147 148 149 150 151 152 153
│   ├── metrics                             // 评估指标
│   │   ├── __init__.py                     // 构造 metric 相关代码
│   │   ├── cls_metric.py                   // 方向分类器 metric
│   │   ├── det_metric.py                   // 检测 metric
    │   ├── eval_det_iou.py                 // 检测 iou 相关
│   │   ├── rec_metric.py                   // 识别 metric
│   ├── modeling                            // 组网相关
│   │   ├── architectures                   // 网络
│   │   │   ├── __init__.py                 // 构造 model 相关代码
│   │   │   ├── base_model.py               // 组网代码
│   │   ├── backbones                       // 骨干网络
│   │   │   ├── __init__.py                 // 构造 backbone 相关代码
│   │   │   ├── det_mobilenet_v3.py         // 检测 mobilenet_v3
│   │   │   ├── det_resnet_vd.py            // 检测 resnet
W
WenmuZhou 已提交
154
│   │   │   ├── det_resnet_vd_sast.py       // 检测 SAST算法的resnet backbone
W
WenmuZhou 已提交
155 156 157 158
│   │   │   ├── rec_mobilenet_v3.py         // 识别 mobilenet_v3
│   │   │   └── rec_resnet_vd.py            // 识别 resnet
│   │   ├── necks                           // 颈函数
│   │   │   ├── __init__.py                 // 构造 neck 相关代码
W
WenmuZhou 已提交
159 160 161
│   │   │   ├── db_fpn.py                   // 标准 fpn 网络
│   │   │   ├── east_fpn.py                 // EAST 算法的 fpn 网络
│   │   │   ├── sast_fpn.py                 // SAST 算法的 fpn 网络
W
WenmuZhou 已提交
162 163 164 165
│   │   │   ├── rnn.py                      // 识别 序列编码
│   │   ├── heads                           // 头函数
│   │   │   ├── __init__.py                 // 构造 head 相关代码
│   │   │   ├── cls_head.py                 // 方向分类器 分类头
W
WenmuZhou 已提交
166
│   │   │   ├── det_db_head.py              // DB 检测头
W
WenmuZhou 已提交
167 168
│   │   │   ├── det_east_head.py            // EAST 检测头
│   │   │   ├── det_sast_head.py            // SAST 检测头
W
WenmuZhou 已提交
169
│   │   │   ├── rec_ctc_head.py             // 识别 ctc
W
WenmuZhou 已提交
170
│   │   │   ├── rec_att_head.py             // 识别 attention 
W
WenmuZhou 已提交
171 172 173 174 175 176 177 178 179 180 181
│   │   ├── transforms                      // 图像变换
│   │   │   ├── __init__.py                 // 构造 transform 相关代码
│   │   │   └── tps.py                      // TPS 变换
│   ├── optimizer                           // 优化器
│   │   ├── __init__.py                     // 构造 optimizer 相关代码
│   │   └── learning_rate.py                // 学习率衰减
│   │   └── optimizer.py                    // 优化器
│   │   └── regularizer.py                  // 网络正则化
│   ├── postprocess                         // 后处理
│   │   ├── cls_postprocess.py              // 方向分类器 后处理
│   │   ├── db_postprocess.py               // DB 后处理
W
WenmuZhou 已提交
182 183 184 185
│   │   ├── east_postprocess.py             // EAST 后处理
│   │   ├── locality_aware_nms.py           // NMS
│   │   ├── rec_postprocess.py              // 识别网络 后处理
│   │   └── sast_postprocess.py             // SAST 后处理
W
WenmuZhou 已提交
186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216
│   └── utils                               // 工具
│       ├── dict                            // 小语种字典
│            ....                            
│       ├── ic15_dict.txt                   // 英文数字字典,区分大小写
│       ├── ppocr_keys_v1.txt               // 中文字典,用于训练中文模型
│       ├── logging.py                      // logger
│       ├── save_load.py                    // 模型保存和加载函数
│       ├── stats.py                        // 统计
│       └── utility.py                      // 工具函数
├── tools
│   ├── eval.py                             // 评估函数
│   ├── export_model.py                     // 导出 inference 模型
│   ├── infer                               // 基于预测引擎预测
│   │   ├── predict_cls.py
│   │   ├── predict_det.py
│   │   ├── predict_rec.py
│   │   ├── predict_system.py
│   │   └── utility.py
│   ├── infer_cls.py                        // 基于训练引擎 预测分类
│   ├── infer_det.py                        // 基于训练引擎 预测检测
│   ├── infer_rec.py                        // 基于训练引擎 预测识别
│   ├── program.py                          // 整体流程
│   ├── test_hubserving.py
│   └── train.py                            // 启动训练
├── paddleocr.py 
├── README_ch.md                            // 中文说明文档
├── README_en.md                            // 英文说明文档
├── README.md                               // 主页说明文档
├── requirments.txt                         // 安装依赖
├── setup.py                                // whl包打包脚本
├── train.sh                                // 启动训练脚本