models_list.md 4.1 KB
Newer Older
文幕地方's avatar
add msg  
文幕地方 已提交
1
# PP-Structure 系列模型列表
文幕地方's avatar
文幕地方 已提交
2

文幕地方's avatar
add msg  
文幕地方 已提交
3
> **说明**
文幕地方's avatar
add msg  
文幕地方 已提交
4
> 1. 本文档提供的是PP-Structure 模型列表,PP-OCR自研模型可以参考: [PP-OCR model_list](../../doc/doc_ch/models_list.md) 。
文幕地方's avatar
add msg  
文幕地方 已提交
5 6

- [PP-Structure 系列模型列表](#pp-structure-系列模型列表)
文幕地方's avatar
文幕地方 已提交
7 8 9
  - [1. LayoutParser 模型](#1-layoutparser-模型)
  - [2. OCR和表格识别模型](#2-ocr和表格识别模型)
    - [2.1 OCR](#21-ocr)
文幕地方's avatar
add msg  
文幕地方 已提交
10
    - [2.2 表格识别模型](#22-表格识别模型)
文幕地方's avatar
文幕地方 已提交
11 12 13
  - [3. VQA模型](#3-vqa模型)
  - [4. KIE模型](#4-kie模型)

文幕地方's avatar
文幕地方 已提交
14 15 16 17 18 19 20 21 22 23 24

## 1. LayoutParser 模型

|模型名称|模型简介|下载地址|
| --- | --- | --- |
| ppyolov2_r50vd_dcn_365e_publaynet | PubLayNet 数据集训练的版面分析模型,可以划分**文字、标题、表格、图片以及列表**5类区域 | [PubLayNet](https://paddle-model-ecology.bj.bcebos.com/model/layout-parser/ppyolov2_r50vd_dcn_365e_publaynet.tar) |
| ppyolov2_r50vd_dcn_365e_tableBank_word | TableBank Word 数据集训练的版面分析模型,只能检测表格 | [TableBank Word](https://paddle-model-ecology.bj.bcebos.com/model/layout-parser/ppyolov2_r50vd_dcn_365e_tableBank_word.tar) |
| ppyolov2_r50vd_dcn_365e_tableBank_latex | TableBank Latex 数据集训练的版面分析模型,只能检测表格 | [TableBank Latex](https://paddle-model-ecology.bj.bcebos.com/model/layout-parser/ppyolov2_r50vd_dcn_365e_tableBank_latex.tar) |

## 2. OCR和表格识别模型

文幕地方's avatar
文幕地方 已提交
25 26
### 2.1 OCR

文幕地方's avatar
文幕地方 已提交
27 28 29 30
|模型名称|模型简介|推理模型大小|下载地址|
| --- | --- | --- | --- |
|en_ppocr_mobile_v2.0_table_det|PubLayNet数据集训练的英文表格场景的文字检测|4.7M|[推理模型](https://paddleocr.bj.bcebos.com/dygraph_v2.0/table/en_ppocr_mobile_v2.0_table_det_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/dygraph_v2.1/table/en_ppocr_mobile_v2.0_table_det_train.tar) |
|en_ppocr_mobile_v2.0_table_rec|PubLayNet数据集训练的英文表格场景的文字识别|6.9M|[推理模型](https://paddleocr.bj.bcebos.com/dygraph_v2.0/table/en_ppocr_mobile_v2.0_table_rec_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/dygraph_v2.1/table/en_ppocr_mobile_v2.0_table_rec_train.tar) |
文幕地方's avatar
文幕地方 已提交
31 32 33

如需要使用其他OCR模型,可以在 [PP-OCR model_list](../../doc/doc_ch/models_list.md) 下载模型或者使用自己训练好的模型配置到 `det_model_dir`, `rec_model_dir`两个字段即可。

文幕地方's avatar
add msg  
文幕地方 已提交
34
### 2.2 表格识别模型
文幕地方's avatar
文幕地方 已提交
35 36 37

|模型名称|模型简介|推理模型大小|下载地址|
| --- | --- | --- | --- |
文幕地方's avatar
文幕地方 已提交
38 39 40 41 42 43
|en_ppocr_mobile_v2.0_table_structure|PubLayNet数据集训练的英文表格场景的表格结构预测|18.6M|[推理模型](https://paddleocr.bj.bcebos.com/dygraph_v2.0/table/en_ppocr_mobile_v2.0_table_structure_infer.tar) / [训练模型](https://paddleocr.bj.bcebos.com/dygraph_v2.1/table/en_ppocr_mobile_v2.0_table_structure_train.tar) |

## 3. VQA模型

|模型名称|模型简介|推理模型大小|下载地址|
| --- | --- | --- | --- |
文幕地方's avatar
文幕地方 已提交
44 45 46 47 48 49 50
|ser_LayoutXLM_xfun_zh|基于LayoutXLM在xfun中文数据集上训练的SER模型|1.4G|[推理模型 coming soon]() / [训练模型](https://paddleocr.bj.bcebos.com/pplayout/re_LayoutXLM_xfun_zh.tar) |
|re_LayoutXLM_xfun_zh|基于LayoutXLM在xfun中文数据集上训练的RE模型|1.4G|[推理模型 coming soon]() / [训练模型](https://paddleocr.bj.bcebos.com/pplayout/ser_LayoutXLM_xfun_zh.tar) |
|ser_LayoutLMv2_xfun_zh|基于LayoutLMv2在xfun中文数据集上训练的SER模型|778M|[推理模型 coming soon]() / [训练模型](https://paddleocr.bj.bcebos.com/pplayout/ser_LayoutLMv2_xfun_zh.tar) |
|re_LayoutLMv2_xfun_zh|基于LayoutLMv2在xfun中文数据集上训练的RE模型|765M|[推理模型 coming soon]() / [训练模型](https://paddleocr.bj.bcebos.com/pplayout/re_LayoutLMv2_xfun_zh.tar) |
|ser_LayoutLM_xfun_zh|基于LayoutLM在xfun中文数据集上训练的SER模型|430M|[推理模型 coming soon]() / [训练模型](https://paddleocr.bj.bcebos.com/pplayout/ser_LayoutLM_xfun_zh.tar) |

## 4. KIE模型
L
LDOUBLEV 已提交
51 52 53

|模型名称|模型简介|模型大小|下载地址|
| --- | --- | --- | --- |
文幕地方's avatar
文幕地方 已提交
54
|SDMGR|关键信息提取模型|78M|[推理模型 coming soon]() / [训练模型](https://paddleocr.bj.bcebos.com/dygraph_v2.1/kie/kie_vgg16.tar)|