benchmark.md 1.6 KB
Newer Older
D
dyning 已提交
1 2
# Benchmark

W
WenmuZhou 已提交
3
本文给出了中英文OCR系列模型精度指标和在各平台预测耗时的benchmark。
D
dyning 已提交
4 5

## 测试数据  
W
WenmuZhou 已提交
6
针对OCR实际应用场景,包括合同,车牌,铭牌,火车票,化验单,表格,证书,街景文字,名片,数码显示屏等,收集的300张图像,每张图平均有17个文本框,下图给出了一些图像示例。
D
dyning 已提交
7

W
WenmuZhou 已提交
8 9 10
<div align="center">
<img src="../datasets/doc.jpg"  width = "1000" height = "500" />
</div>
D
dyning 已提交
11

W
WenmuZhou 已提交
12
## 评估指标  
D
dyning 已提交
13

W
WenmuZhou 已提交
14
说明:
T
tink2123 已提交
15

W
WenmuZhou 已提交
16
- 检测输入图像的的长边尺寸是960。
T
tink2123 已提交
17
- 评估耗时阶段为图像预测耗时,不包括图像的预处理和后处理。  
W
WenmuZhou 已提交
18
- `Intel至强6148`为服务器端CPU型号,测试中使用Intel MKL-DNN 加速。
D
dyning 已提交
19
- `骁龙855`为移动端处理平台型号。  
W
WenmuZhou 已提交
20

T
tink2123 已提交
21
预测模型大小和整体识别精度对比
W
WenmuZhou 已提交
22 23 24

| 模型名称                     | 整体模型<br>大小\(M\) | 检测模型<br>大小\(M\) | 方向分类器<br>模型大小\(M\) | 识别模型<br>大小\(M\) | 整体识别<br>F\-score |
|:-:|:-:|:-:|:-:|:-:|:-:|
T
tink2123 已提交
25 26 27
| PP-OCRv2 | 11\.6        | 3\.0        | 0\.9           | 8\.6        | 0\.5224      |
| PP-OCR mobile |   8\.1  | 2\.6        | 0\.9           | 4\.6        | 0\.503       |
| PP-OCR server | 155\.1  | 47\.2       | 0\.9           | 107         | 0\.570       |
W
WenmuZhou 已提交
28 29


T
tink2123 已提交
30
预测模型在CPU和GPU上的速度对比,单位ms
W
WenmuZhou 已提交
31

T
tink2123 已提交
32 33 34 35 36
| 模型名称                     | CPU   | T4 GPU  |
|:-:|:-:|:-:|
| PP-OCRv2 | 330  | 111 |
| PP-OCR mobile | 356  | 11 6|
| PP-OCR server | 1056  | 200 |
W
WenmuZhou 已提交
37

T
tink2123 已提交
38
更多 PP-OCR 系列模型的预测指标可以参考[PP-OCR Benchamrk](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/doc/doc_ch/benchmark.md)