README.md 13.1 KB
Newer Older
1
# MeterReader工业表计读数
F
FlyingQianMM 已提交
2 3 4

本案例基于PaddleX实现对传统机械式指针表计的检测与自动读数功能,开放表计数据和预训练模型,并提供在windows系统的服务器端以及linux系统的jetson嵌入式设备上的部署指南。

F
FlyingQianMM 已提交
5
## 目录
F
FlyingQianMM 已提交
6

F
FlyingQianMM 已提交
7 8 9 10 11
* [读数流程](#1)
* [表计数据和预训练模型](#2)
* [快速体验表盘读数](#3)
* [推理部署](#4)
* [模型训练](#5)
F
FlyingQianMM 已提交
12

F
FlyingQianMM 已提交
13 14

## <h2 id="1">读数流程</h2>
F
FlyingQianMM 已提交
15

F
FlyingQianMM 已提交
16 17 18
表计读数共分为三个步骤完成:

* 第一步,使用目标检测模型检测出图像中的表计
19
* 第二步,使用语义分割模型将各表计的指针和刻度分割出来
F
FlyingQianMM 已提交
20
* 第三步,根据指针的相对位置和预知的量程计算出各表计的读数。
F
FlyingQianMM 已提交
21 22 23

![MeterReader_Architecture](image/MeterReader_Architecture.jpg)

F
FlyingQianMM 已提交
24 25 26
* **表计检测**:由于本案例中没有面积较小的表计,所以目标检测模型选择性能更优的**YOLOv3**。考虑到本案例主要在有GPU的设备上部署,所以骨干网路选择精度更高的**DarkNet53**
* **刻度和指针分割**:考虑到刻度和指针均为细小区域,语义分割模型选择效果更好的**DeepLapv3**
* **读数后处理**:首先,对语义分割的预测类别图进行图像腐蚀操作,以达到刻度细分的目的。然后把环形的表盘展开为矩形图像,根据图像中类别信息生成一维的刻度数组和一维的指针数组。接着计算刻度数组的均值,用均值对刻度数组进行二值化操作。最后定位出指针相对刻度的位置,根据刻度的根数判断表盘的类型以此获取表盘的量程,将指针相对位置与量程做乘积得到表盘的读数。
F
FlyingQianMM 已提交
27 28


F
FlyingQianMM 已提交
29
## <h2 id="2">表计数据和预训练模型</h2>
F
FlyingQianMM 已提交
30 31 32 33 34

本案例开放了表计测试图片,用于体验表计读数的预测推理全流程。还开放了表计检测数据集、指针和刻度分割数据集,用户可以使用这些数据集重新训练模型。

| 表计测试图片                                                 | 表计检测数据集                                               | 指针和刻度分割数据集                                         |
| ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
F
FlyingQianMM 已提交
35
| [meter_test](https://bj.bcebos.com/paddlex/examples/meter_reader/datasets/meter_test.tar.gz) | [meter_det](https://bj.bcebos.com/paddlex/examples/meter_reader/datasets/meter_det.tar.gz) | [meter_seg](https://bj.bcebos.com/paddlex/examples/meter_reader/datasets/meter_seg.tar.gz) |
F
FlyingQianMM 已提交
36 37 38 39 40

本案例开放了预先训练好的检测模型和语义分割模型,可以使用这些模型快速体验表计读数全流程,也可以直接将这些模型部署在服务器端或jetson嵌入式设备上进行推理预测。

| 表计检测模型                                                 | 指针和刻度分割模型                                           |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
F
FlyingQianMM 已提交
41
| [meter_det_inference_model](https://bj.bcebos.com/paddlex/examples/meter_reader/models/meter_det_inference_model.tar.gz) | [meter_seg_inference_model](https://bj.bcebos.com/paddlex/examples/meter_reader/models/meter_seg_inference_model.tar.gz) |
F
FlyingQianMM 已提交
42 43


F
FlyingQianMM 已提交
44
## <h2 id="3">快速体验表盘读数</h2>
F
FlyingQianMM 已提交
45 46 47 48 49 50 51 52 53

可以使用本案例提供的预训练模型快速体验表计读数的自动预测全流程。如果不需要预训练模型,可以跳转至小节`模型训练` 重新训练模型。

#### 前置依赖

* Paddle paddle >= 1.8.0
* Python >= 3.5
* PaddleX >= 1.0.0

54
安装的相关问题参考[PaddleX安装](../../docs/install.md)
F
FlyingQianMM 已提交
55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83

#### 测试表计读数

1. 下载PaddleX源码:

```
git clone https://github.com/PaddlePaddle/PaddleX
```

2. 预测执行文件位于`PaddleX/examples/meter_reader/`,进入该目录:

```
cd PaddleX/examples/meter_reader/
```

预测执行文件为`reader_infer.py`,其主要参数说明如下:


| 参数    | 说明   |
| ---- | ---- |
|  detector_dir    | 表计检测模型路径     |
|	segmenter_dir		 | 指针和刻度分割模型路径|
|	image            | 待预测的图片路径  |
|  image_dir       | 存储待预测图片的文件夹路径 |
| save_dir	| 保存可视化结果的路径, 默认值为"output"|
| score_threshold | 检测模型输出结果中,预测得分低于该阈值的框将被滤除,默认值为0.5|
| seg_batch_size | 分割的批量大小,默认为2 |
| seg_thread_num	| 分割预测的线程数,默认为cpu处理器个数 |
| use_camera | 是否使用摄像头采集图片,默认为False |
F
FlyingQianMM 已提交
84
| camera_id | 摄像头设备ID,默认值为0 |
F
FlyingQianMM 已提交
85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117
| use_erode | 是否使用图像腐蚀对分割预测图进行细分,默认为False |
| erode_kernel | 图像腐蚀操作时的卷积核大小,默认值为4 |

3. 预测

若要使用GPU,则指定GPU卡号(以0号卡为例):

```shell
export CUDA_VISIBLE_DEVICES=0
```
若不使用GPU,则将CUDA_VISIBLE_DEVICES指定为空:
```shell
export CUDA_VISIBLE_DEVICES=
```

* 预测单张图片

```shell
python3 reader_infer.py --detector_dir /path/to/det_inference_model --segmenter_dir /path/to/seg_inference_model --image /path/to/meter_test/20190822_168.jpg --save_dir ./output --use_erode
```

* 预测多张图片

```shell
python3 reader_infer.py --detector_dir /path/to/det_inference_model --segmenter_dir /path/to/seg_inference_model --image_dir /path/to/meter_test --save_dir ./output --use_erode
```

* 开启摄像头预测

```shell
python3 reader_infer.py --detector_dir /path/to/det_inference_model --segmenter_dir /path/to/seg_inference_model --save_dir ./output --use_erode --use_camera
```

F
FlyingQianMM 已提交
118
## <h2 id="4">推理部署</h2>
F
FlyingQianMM 已提交
119 120 121 122 123 124 125 126 127 128 129

### Windows系统的服务器端安全部署

#### c++部署

1. 下载PaddleX源码:

```
git clone https://github.com/PaddlePaddle/PaddleX
```

F
FlyingQianMM 已提交
130
2.`PaddleX\examples\meter_reader\deploy\cpp`下的`meter_reader`文件夹和`CMakeList.txt`拷贝至`PaddleX\deploy\cpp`目录下,拷贝之前可以将`PaddleX\deploy\cpp`下原本的`CMakeList.txt`做好备份。
F
FlyingQianMM 已提交
131

132
3. 按照[Windows平台部署](../../docs/deploy/server/cpp/windows.md)中的Step2至Step4完成C++预测代码的编译。
F
FlyingQianMM 已提交
133 134 135 136 137 138 139

4. 编译成功后,可执行文件在`out\build\x64-Release`目录下,打开`cmd`,并切换到该目录:

   ```
   cd PaddleX\deploy\cpp\out\build\x64-Release
   ```

F
FlyingQianMM 已提交
140
   预测程序为paddle_inference\meter_reader.exe,其主要命令参数说明如下:
F
FlyingQianMM 已提交
141

F
FlyingQianMM 已提交
142 143 144 145 146 147 148 149 150 151 152 153 154 155 156
   | 参数    | 说明   |
   | ---- | ---- |
   |  det_model_dir    | 表计检测模型路径     |
   |	seg_model_dir		 | 指针和刻度分割模型路径|
   |	image            | 待预测的图片路径  |
   |  image_list       | 按行存储图片路径的.txt文件 |
   | use_gpu	| 是否使用 GPU 预测, 支持值为0或1(默认值为0)|
   | gpu_id	| GPU 设备ID, 默认值为0 |
   | save_dir	| 保存可视化结果的路径, 默认值为"output"|
   | seg_batch_size | 分割的批量大小,默认为2 |
   | thread_num	| 分割预测的线程数,默认为cpu处理器个数 |
   | use_camera | 是否使用摄像头采集图片,支持值为0或1(默认值为0) |
   | camera_id | 摄像头设备ID,默认值为0 |
   | use_erode | 是否使用图像腐蚀对分割预测图进行去噪,支持值为0或1(默认值为1) |
   | erode_kernel | 图像腐蚀操作时的卷积核大小,默认值为4 |
F
FlyingQianMM 已提交
157
   | score_threshold | 检测模型输出结果中,预测得分低于该阈值的框将被滤除,默认值为0.5|
F
FlyingQianMM 已提交
158 159 160

5. 推理预测:

F
FlyingQianMM 已提交
161
  用于部署推理的模型应为inference格式,本案例提供的预训练模型均为inference格式,如若是重新训练的模型,需参考[导出inference模型](https://paddlex.readthedocs.io/zh_CN/latest/tutorials/deploy/deploy_server/deploy_python.html#inference)将模型导出为inference格式。
F
FlyingQianMM 已提交
162 163 164

  * 使用未加密的模型对单张图片做预测
  ```shell
F
FlyingQianMM 已提交
165
  .\paddlex_inference\meter_reader.exe --det_model_dir=\path\to\det_inference_model --seg_model_dir=\path\to\seg_inference_model --image=\path\to\meter_test\20190822_168.jpg --use_gpu=1 --use_erode=1 --save_dir=output
F
FlyingQianMM 已提交
166
  ```
F
FlyingQianMM 已提交
167

F
FlyingQianMM 已提交
168
  * 使用未加密的模型对图像列表做预测
F
FlyingQianMM 已提交
169

170 171 172 173 174 175 176 177
  图像列表image_list.txt内容的格式如下,因绝对路径不同,暂未提供该文件,用户可根据实际情况自行生成:
  ```
  \path\to\images\1.jpg
  \path\to\images\2.jpg
  ...
  \path\to\images\n.jpg
  ```

F
FlyingQianMM 已提交
178
  ```shell
F
FlyingQianMM 已提交
179
  .\paddlex_inference\meter_reader.exe --det_model_dir=\path\to\det_inference_model --seg_model_dir=\path\to\seg_inference_model --image_list=\path\to\meter_test\image_list.txt --use_gpu=1 --use_erode=1 --save_dir=output
F
FlyingQianMM 已提交
180
  ```
F
FlyingQianMM 已提交
181

F
FlyingQianMM 已提交
182
  * 使用未加密的模型开启摄像头做预测
F
FlyingQianMM 已提交
183

F
FlyingQianMM 已提交
184
  ```shell
F
FlyingQianMM 已提交
185
  .\paddlex_inference\meter_reader.exe --det_model_dir=\path\to\det_inference_model --seg_model_dir=\path\to\seg_inference_model --use_camera=1 --use_gpu=1 --use_erode=1 --save_dir=output
F
FlyingQianMM 已提交
186
  ```
F
FlyingQianMM 已提交
187

188 189 190 191 192 193 194 195
  * 使用加密后的模型对单张图片做预测  

  如果未对模型进行加密,请参考[加密PaddleX模型](../../docs/deploy/server/encryption.md#13-加密paddlex模型)对模型进行加密。例如加密后的检测模型所在目录为`\path\to\encrypted_det_inference_model`,密钥为`yEBLDiBOdlj+5EsNNrABhfDuQGkdcreYcHcncqwdbx0=`;加密后的分割模型所在目录为`\path\to\encrypted_seg_inference_model`,密钥为`DbVS64I9pFRo5XmQ8MNV2kSGsfEr4FKA6OH9OUhRrsY=`  

  ```shell  
  .\paddlex_inference\meter_reader.exe --det_model_dir=\path\to\encrypted_det_inference_model --seg_model_dir=\path\to\encrypted_seg_inference_model --image=\path\to\test.jpg --use_gpu=1 --use_erode=1 --save_dir=output --det_key yEBLDiBOdlj+5EsNNrABhfDuQGkdcreYcHcncqwdbx0= --seg_key DbVS64I9pFRo5XmQ8MNV2kSGsfEr4FKA6OH9OUhRrsY=  
  ```

F
FlyingQianMM 已提交
196
### Linux系统的jetson嵌入式设备安全部署
F
FlyingQianMM 已提交
197 198 199 200 201 202 203 204 205

#### c++部署

1. 下载PaddleX源码:

```
git clone https://github.com/PaddlePaddle/PaddleX
```

F
FlyingQianMM 已提交
206
2.`PaddleX/examples/meter_reader/deploy/cpp`下的`meter_reader`文件夹和`CMakeList.txt`拷贝至`PaddleX/deploy/cpp`目录下,拷贝之前可以将`PaddleX/deploy/cpp`下原本的`CMakeList.txt`做好备份。
F
FlyingQianMM 已提交
207

208
3. 按照[Nvidia Jetson开发板部署](../../docs/deploy/nvidia-jetson.md)中的Step2至Step3完成C++预测代码的编译。
F
FlyingQianMM 已提交
209

F
FlyingQianMM 已提交
210 211
4. 编译成功后,可执行程为`build/meter_reader/meter_reader`,其主要命令参数说明如下:

F
FlyingQianMM 已提交
212
  | 参数    | 说明   |
F
FlyingQianMM 已提交
213 214 215 216 217 218 219 220 221 222 223 224 225 226
  | ---- | ---- |
  |  det_model_dir    | 表计检测模型路径     |
  |	seg_model_dir		 | 指针和刻度分割模型路径|
  |	image            | 待预测的图片路径  |
  |  image_list       | 按行存储图片路径的.txt文件 |
  | use_gpu	| 是否使用 GPU 预测, 支持值为0或1(默认值为0)|
  | gpu_id	| GPU 设备ID, 默认值为0 |
  | save_dir	| 保存可视化结果的路径, 默认值为"output"|
  | seg_batch_size | 分割的批量大小,默认为2 |
  | thread_num	| 分割预测的线程数,默认为cpu处理器个数 |
  | use_camera | 是否使用摄像头采集图片,支持值为0或1(默认值为0) |
  | camera_id | 摄像头设备ID,默认值为0 |
  | use_erode | 是否使用图像腐蚀对分割预测图进行细分,支持值为0或1(默认值为1) |
  | erode_kernel | 图像腐蚀操作时的卷积核大小,默认值为4 |
F
FlyingQianMM 已提交
227
  | score_threshold | 检测模型输出结果中,预测得分低于该阈值的框将被滤除,默认值为0.5|
F
FlyingQianMM 已提交
228

F
FlyingQianMM 已提交
229 230
5. 推理预测:

231
  用于部署推理的模型应为inference格式,本案例提供的预训练模型均为inference格式,如若是重新训练的模型,需参考[部署模型导出](../../docs/deploy/export_model.md)将模型导出为inference格式。
F
FlyingQianMM 已提交
232 233

  * 使用未加密的模型对单张图片做预测
F
FlyingQianMM 已提交
234

F
FlyingQianMM 已提交
235
  ```shell
F
FlyingQianMM 已提交
236
  ./build/meter_reader/meter_reader --det_model_dir=/path/to/det_inference_model --seg_model_dir=/path/to/seg_inference_model --image=/path/to/meter_test/20190822_168.jpg --use_gpu=1 --use_erode=1 --save_dir=output
F
FlyingQianMM 已提交
237
  ```
F
FlyingQianMM 已提交
238

F
FlyingQianMM 已提交
239
  * 使用未加密的模型对图像列表做预测
240 241 242 243 244 245 246
  图像列表image_list.txt内容的格式如下,因绝对路径不同,暂未提供该文件,用户可根据实际情况自行生成:
  ```
  \path\to\images\1.jpg
  \path\to\images\2.jpg
  ...
  \path\to\images\n.jpg
  ```
F
FlyingQianMM 已提交
247

F
FlyingQianMM 已提交
248
  ```shell
F
FlyingQianMM 已提交
249
  ./build/meter_reader/meter_reader --det_model_dir=/path/to/det_inference_model --seg_model_dir=/path/to/seg_inference_model --image_list=/path/to/image_list.txt --use_gpu=1 --use_erode=1 --save_dir=output
F
FlyingQianMM 已提交
250
  ```
F
FlyingQianMM 已提交
251

F
FlyingQianMM 已提交
252
  * 使用未加密的模型开启摄像头做预测
F
FlyingQianMM 已提交
253

F
FlyingQianMM 已提交
254
  ```shell
F
FlyingQianMM 已提交
255
  ./build/meter_reader/meter_reader --det_model_dir=/path/to/det_inference_model --seg_model_dir=/path/to/seg_inference_model --use_camera=1 --use_gpu=1 --use_erode=1 --save_dir=output
F
FlyingQianMM 已提交
256 257
  ```

F
FlyingQianMM 已提交
258 259 260 261 262 263 264 265 266
## <h2 id="5">模型训练</h2>


#### 前置依赖

* Paddle paddle >= 1.8.0
* Python >= 3.5
* PaddleX >= 1.0.0

267
安装的相关问题参考[PaddleX安装](../../docs/install.md)
F
FlyingQianMM 已提交
268 269 270 271 272 273 274 275 276 277 278 279 280 281 282

#### 训练

* 表盘检测的训练
```
python3 /path/to/PaddleX/examples/meter_reader/train_detection.py
```
* 指针和刻度分割的训练

```
python3 /path/to/PaddleX/examples/meter_reader/train_segmentation.py

```

运行以上脚本可以训练本案例的检测模型和分割模型。如果不需要本案例的数据和模型参数,可更换数据,选择合适的模型并调整训练参数。