Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
d850046e
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
d850046e
编写于
6月 09, 2022
作者:
A
andyjpaddle
浏览文件
操作
浏览文件
下载
差异文件
Merge branch 'dygraph' of
https://github.com/PaddlePaddle/PaddleOCR
into dygraph
上级
da944891
2735b33b
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
8 addition
and
13 deletion
+8
-13
doc/doc_ch/dataset/layout_datasets.md
doc/doc_ch/dataset/layout_datasets.md
+6
-6
ppocr/modeling/backbones/kie_unet_sdmgr.py
ppocr/modeling/backbones/kie_unet_sdmgr.py
+1
-6
tools/export_model.py
tools/export_model.py
+1
-1
未找到文件。
doc/doc_ch/dataset/layout_datasets.md
浏览文件 @
d850046e
...
@@ -15,8 +15,8 @@
...
@@ -15,8 +15,8 @@
-
**数据简介**
:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。总共包含5个类别,分别是:
`text, title, list, table, figure`
。部分图像以及标注框可视化如下所示。
-
**数据简介**
:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。总共包含5个类别,分别是:
`text, title, list, table, figure`
。部分图像以及标注框可视化如下所示。
<div
align=
"center"
>
<div
align=
"center"
>
<img
src=
"../datasets/publaynet_demo/gt_PMC3724501_00006.jpg"
width=
"500"
>
<img
src=
"../
../
datasets/publaynet_demo/gt_PMC3724501_00006.jpg"
width=
"500"
>
<img
src=
"../datasets/publaynet_demo/gt_PMC5086060_00002.jpg"
width=
"500"
>
<img
src=
"../
../
datasets/publaynet_demo/gt_PMC5086060_00002.jpg"
width=
"500"
>
</div>
</div>
-
**下载地址**
:https://developer.ibm.com/exchanges/data/all/publaynet/
-
**下载地址**
:https://developer.ibm.com/exchanges/data/all/publaynet/
...
@@ -30,8 +30,8 @@
...
@@ -30,8 +30,8 @@
-
**数据简介**
:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像。总共包含10个类别,分别是:
`Text, Title, Figure, Figure caption, Table, Table caption, Header, Footer, Reference, Equation`
。部分图像以及标注框可视化如下所示。
-
**数据简介**
:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像。总共包含10个类别,分别是:
`Text, Title, Figure, Figure caption, Table, Table caption, Header, Footer, Reference, Equation`
。部分图像以及标注框可视化如下所示。
<div
align=
"center"
>
<div
align=
"center"
>
<img
src=
"../datasets/CDLA_demo/val_0633.jpg"
width=
"500"
>
<img
src=
"../
../
datasets/CDLA_demo/val_0633.jpg"
width=
"500"
>
<img
src=
"../datasets/CDLA_demo/val_0941.jpg"
width=
"500"
>
<img
src=
"../
../
datasets/CDLA_demo/val_0941.jpg"
width=
"500"
>
</div>
</div>
-
**下载地址**
:https://github.com/buptlihang/CDLA
-
**下载地址**
:https://github.com/buptlihang/CDLA
...
@@ -45,8 +45,8 @@
...
@@ -45,8 +45,8 @@
-
**数据简介**
:TableBank数据集包含Latex(训练集187199张,验证集7265张,测试集5719张)与Word(训练集73383张,验证集2735张,测试集2281张)两种类别的文档。仅包含
`Table`
1个类别。部分图像以及标注框可视化如下所示。
-
**数据简介**
:TableBank数据集包含Latex(训练集187199张,验证集7265张,测试集5719张)与Word(训练集73383张,验证集2735张,测试集2281张)两种类别的文档。仅包含
`Table`
1个类别。部分图像以及标注框可视化如下所示。
<div
align=
"center"
>
<div
align=
"center"
>
<img
src=
"../datasets/tablebank_demo/004.png"
height=
"700"
>
<img
src=
"../
../
datasets/tablebank_demo/004.png"
height=
"700"
>
<img
src=
"../datasets/tablebank_demo/005.png"
height=
"700"
>
<img
src=
"../
../
datasets/tablebank_demo/005.png"
height=
"700"
>
</div>
</div>
-
**下载地址**
:https://doc-analysis.github.io/tablebank-page/index.html
-
**下载地址**
:https://doc-analysis.github.io/tablebank-page/index.html
...
...
ppocr/modeling/backbones/kie_unet_sdmgr.py
浏览文件 @
d850046e
...
@@ -176,11 +176,6 @@ class Kie_backbone(nn.Layer):
...
@@ -176,11 +176,6 @@ class Kie_backbone(nn.Layer):
x
=
self
.
img_feat
(
img
)
x
=
self
.
img_feat
(
img
)
boxes
,
rois_num
=
self
.
bbox2roi
(
gt_bboxes
)
boxes
,
rois_num
=
self
.
bbox2roi
(
gt_bboxes
)
feats
=
paddle
.
vision
.
ops
.
roi_align
(
feats
=
paddle
.
vision
.
ops
.
roi_align
(
x
,
x
,
boxes
,
spatial_scale
=
1.0
,
output_size
=
7
,
boxes_num
=
rois_num
)
boxes
,
spatial_scale
=
1.0
,
pooled_height
=
7
,
pooled_width
=
7
,
rois_num
=
rois_num
)
feats
=
self
.
maxpool
(
feats
).
squeeze
(
-
1
).
squeeze
(
-
1
)
feats
=
self
.
maxpool
(
feats
).
squeeze
(
-
1
).
squeeze
(
-
1
)
return
[
relations
,
texts
,
feats
]
return
[
relations
,
texts
,
feats
]
tools/export_model.py
浏览文件 @
d850046e
...
@@ -76,7 +76,7 @@ def export_single_model(model, arch_config, save_path, logger, quanter=None):
...
@@ -76,7 +76,7 @@ def export_single_model(model, arch_config, save_path, logger, quanter=None):
else
:
else
:
infer_shape
=
[
3
,
-
1
,
-
1
]
infer_shape
=
[
3
,
-
1
,
-
1
]
if
arch_config
[
"model_type"
]
==
"rec"
:
if
arch_config
[
"model_type"
]
==
"rec"
:
infer_shape
=
[
3
,
32
,
-
1
]
# for rec model, H must be 32
infer_shape
=
[
3
,
48
,
-
1
]
# for rec model, H must be 32
if
"Transform"
in
arch_config
and
arch_config
[
if
"Transform"
in
arch_config
and
arch_config
[
"Transform"
]
is
not
None
and
arch_config
[
"Transform"
][
"Transform"
]
is
not
None
and
arch_config
[
"Transform"
][
"name"
]
==
"TPS"
:
"name"
]
==
"TPS"
:
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录