Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleOCR
提交
4b9ff078
P
PaddleOCR
项目概览
s920243400
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
4b9ff078
编写于
12月 13, 2021
作者:
文幕地方
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update readme
上级
0a410708
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
40 addition
and
2 deletion
+40
-2
ppstructure/README_ch.md
ppstructure/README_ch.md
+40
-2
未找到文件。
ppstructure/README_ch.md
浏览文件 @
4b9ff078
[
English
](
README.md
)
| 简体中文
[
English
](
README.md
)
| 简体中文
# PP-Structure
## 简介
PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包,旨在帮助开发者更好的完成文档理解相关任务。
## 近期更新
*
2021.12.07 新增VQA任务-SER和RE。
## 特性
PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包,主要特性如下:
PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包,主要特性如下:
-
支持对图片形式的文档进行版面分析,可以划分
**文字、标题、表格、图片以及列表**
5类区域(与Layout-Parser联合使用)
-
支持对图片形式的文档进行版面分析,可以划分
**文字、标题、表格、图片以及列表**
5类区域(与Layout-Parser联合使用)
...
@@ -8,7 +14,7 @@ PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包
...
@@ -8,7 +14,7 @@ PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包
-
支持表格区域进行结构化分析,最终结果输出Excel文件
-
支持表格区域进行结构化分析,最终结果输出Excel文件
-
支持python whl包和命令行两种方式,简单易用
-
支持python whl包和命令行两种方式,简单易用
-
支持版面分析和表格结构化两类任务自定义训练
-
支持版面分析和表格结构化两类任务自定义训练
-
支持
文档关键信息提取-SER和RE任务
-
支持
VQA任务-SER和RE
## 1. 效果展示
## 1. 效果展示
...
@@ -40,6 +46,9 @@ PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包
...
@@ -40,6 +46,9 @@ PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包
图中红色框表示问题,蓝色框表示答案,问题和答案之间使用绿色线连接。在OCR检测框的左上方也标出了对应的类别和OCR识别结果。
图中红色框表示问题,蓝色框表示答案,问题和答案之间使用绿色线连接。在OCR检测框的左上方也标出了对应的类别和OCR识别结果。
## 2. 快速体验
代码体验:从
[
快速安装
](
./docs/quickstart.md
)
开始
## 3. PP-Structure Pipeline介绍
## 3. PP-Structure Pipeline介绍
...
@@ -61,3 +70,32 @@ PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包
...
@@ -61,3 +70,32 @@ PP-Structure是一个可用于复杂文档结构分析和处理的OCR工具包
### 3.2 VQA
### 3.2 VQA
coming soon
coming soon
## 4. 模型库
PP-Structure系列模型列表(更新中)
*
LayoutParser 模型
|模型名称|模型简介|下载地址|
| --- | --- | --- |
| ppyolov2_r50vd_dcn_365e_publaynet | PubLayNet 数据集训练的版面分析模型,可以划分
**文字、标题、表格、图片以及列表**
5类区域 |
[
PubLayNet
](
https://paddle-model-ecology.bj.bcebos.com/model/layout-parser/ppyolov2_r50vd_dcn_365e_publaynet.tar
)
|
*
OCR和表格识别模型
|模型名称|模型简介|推理模型大小|下载地址|
| --- | --- | --- | --- |
|ch_ppocr_mobile_slim_v2.0_det|slim裁剪版超轻量模型,支持中英文、多语种文本检测|2.6M|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/slim/ch_ppocr_mobile_v2.0_det_prune_infer.tar
)
/
[
训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/slim/ch_ppocr_mobile_v2.0_det_prune_infer.tar
)
|
|ch_ppocr_mobile_slim_v2.0_rec|slim裁剪量化版超轻量模型,支持中英文、数字识别|6M|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_slim_infer.tar
)
/
[
训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_slim_train.tar
)
|
|en_ppocr_mobile_v2.0_table_structure|PubLayNet数据集训练的英文表格场景的表格结构预测|18.6M|
[
推理模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/table/en_ppocr_mobile_v2.0_table_structure_infer.tar
)
/
[
训练模型
](
https://paddleocr.bj.bcebos.com/dygraph_v2.1/table/en_ppocr_mobile_v2.0_table_structure_train.tar
)
|
*
VQA模型
|模型名称|模型简介|推理模型大小|下载地址|
| --- | --- | --- | --- |
|PP-Layout_v1.0_ser_pretrained|基于LayoutXLM在xfun中文数据集上训练的SER模型|1.4G|
[
推理模型 coming soon
](
)
/
[
训练模型
](
https://paddleocr.bj.bcebos.com/pplayout/PP-Layout_v1.0_ser_pretrained.tar
)
|
|PP-Layout_v1.0_re_pretrained|基于LayoutXLM在xfun中文数据集上训练的RE模型|1.4G|
[
推理模型 coming soon
](
)
/
[
训练模型
](
https://paddleocr.bj.bcebos.com/pplayout/PP-Layout_v1.0_re_pretrained.tar
)
|
更多模型下载,可以参考
[
模型库
](
./docs/model_list.md
)
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录