Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
7f34bd78
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
7f34bd78
编写于
8月 23, 2022
作者:
littletomatodonkey
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix doc
上级
bd4eb1b8
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
2 addition
and
2 deletion
+2
-2
ppstructure/docs/PP-Structurev2_introduction.md
ppstructure/docs/PP-Structurev2_introduction.md
+2
-2
未找到文件。
ppstructure/docs/PP-Structurev2_introduction.md
浏览文件 @
7f34bd78
...
...
@@ -54,7 +54,7 @@ PP-Structurev2系统流程图如下所示,文档图像首先经过图像矫正
最终,与PP-Structurev1相比:
-
版面分析模型参数量减少
87
%,推理速度提升12倍,精度提升0.4%;
-
版面分析模型参数量减少
90.8
%,推理速度提升12倍,精度提升0.4%;
-
表格识别预测耗时不变,模型精度提升6%,端到端TEDS提升2%;
-
关键信息抽取模型速度提升2.8倍,语义实体识别模型精度提升2.8%;关系抽取模型精度提升9.1%。
...
...
@@ -312,7 +312,7 @@ LayoutLMv2以及LayoutXLM中引入视觉骨干网络,用于提取视觉特征
同时,基于XFUND数据集,VI-LayoutXLM在RE任务上的精度也进一步提升了
`1.06%`
。
**(2) TB-YX排序方法(Threshold-Based YX sorting algorithm)
**
**(2) TB-YX排序方法(Threshold-Based YX sorting algorithm)**
文本阅读顺序对于信息抽取与文本理解等任务至关重要,传统多模态模型中,没有考虑不同OCR工具可能产生的不正确阅读顺序,而模型输入中包含位置编码,阅读顺序会直接影响预测结果,在预处理中,我们对文本行按照从上到下,从左到右(YX)的顺序进行排序,为防止文本行位置轻微干扰带来的排序结果不稳定问题,在排序的过程中,引入位置偏移阈值Th,对于Y方向距离小于Th的2个文本内容,使用x方向的位置从左到右进行排序。TB-YX排序方法伪代码如下所示。
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录