Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
e41dfc6e
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
e41dfc6e
编写于
5月 13, 2022
作者:
qq_25193841
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update PPOCRLabel
Update PPOCRLabel
上级
ffd9e572
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
11356 addition
and
11330 deletion
+11356
-11330
PPOCRLabel/PPOCRLabel.py
PPOCRLabel/PPOCRLabel.py
+1
-15
PPOCRLabel/libs/resources.py
PPOCRLabel/libs/resources.py
+11351
-11311
PPOCRLabel/libs/utils.py
PPOCRLabel/libs/utils.py
+2
-2
PPOCRLabel/resources/strings/strings-en.properties
PPOCRLabel/resources/strings/strings-en.properties
+1
-1
PPOCRLabel/resources/strings/strings-zh-CN.properties
PPOCRLabel/resources/strings/strings-zh-CN.properties
+1
-1
未找到文件。
PPOCRLabel/PPOCRLabel.py
浏览文件 @
e41dfc6e
...
...
@@ -2322,13 +2322,6 @@ class MainWindow(QMainWindow):
else
:
labeldict
[
file
]
=
[]
# if len(labeldict) != len(csv_paths):
# msg = 'ERROR, box label and excel label are not in the same number\n' + \
# 'box label: ' + str(len(labeldict)) + '\n' + \
# 'excel label: ' + str(len(csv_paths)) + '\n' + \
# 'Please check the label.txt and tableRec_excel_output\n'
# QMessageBox.information(self, "Information", msg)
# return
train_split
,
val_split
,
test_split
=
partitionDialog
.
getDataPartition
()
# check validate
if
train_split
+
val_split
+
test_split
>
100
:
...
...
@@ -2351,14 +2344,8 @@ class MainWindow(QMainWindow):
filename
,
_
=
os
.
path
.
splitext
(
os
.
path
.
basename
(
image_path
))
csv_path
=
os
.
path
.
join
(
TableRec_excel_dir
,
filename
+
'.xlsx'
)
if
not
os
.
path
.
exists
(
csv_path
):
msg
=
'ERROR, Can not find '
+
csv_path
QMessageBox
.
information
(
self
,
"Information"
,
msg
)
return
continue
# read xlsx file, convert to HTML
# xd = pd.ExcelFile(csv_path)
# df = xd.parse()
# structure = df.to_html(index = False)
excel
=
xlrd
.
open_workbook
(
csv_path
)
sheet0
=
excel
.
sheet_by_index
(
0
)
# only sheet 0
merged_cells
=
sheet0
.
merged_cells
# (0,1,1,3) start row, end row, start col, end col
...
...
@@ -2370,7 +2357,6 @@ class MainWindow(QMainWindow):
token_list
=
convert_token
(
html_list
)
# load box annotations
cells
=
[]
for
anno
in
labeldict
[
image_path
]:
...
...
PPOCRLabel/libs/resources.py
浏览文件 @
e41dfc6e
因为 它太大了无法显示 source diff 。你可以改为
查看blob
。
PPOCRLabel/libs/utils.py
浏览文件 @
e41dfc6e
...
...
@@ -221,10 +221,10 @@ def convert_token(html_list):
token_list
.
append
(
"<td"
)
if
'colspan'
in
col
:
_
,
n
=
col
.
split
(
'colspan='
)
token_list
.
append
(
" colspan=
\"
{}
\"
"
.
format
(
n
))
token_list
.
append
(
" colspan=
\"
{}
\"
"
.
format
(
n
[
0
]
))
if
'rowspan'
in
col
:
_
,
n
=
col
.
split
(
'rowspan='
)
token_list
.
append
(
" rowspan=
\"
{}
\"
"
.
format
(
n
))
token_list
.
append
(
" rowspan=
\"
{}
\"
"
.
format
(
n
[
0
]
))
token_list
.
extend
([
">"
,
"</td>"
])
token_list
.
append
(
"</tr>"
)
token_list
.
append
(
"</tbody>"
)
...
...
PPOCRLabel/resources/strings/strings-en.properties
浏览文件 @
e41dfc6e
...
...
@@ -112,4 +112,4 @@ keyDialogTip=Enter object label
keyChange
=
Change Box Key
TableRecognition
=
Table Recognition
cellreRecognition
=
Cell Re-Recognition
exportJSON
=
export JSON
(PubTabNet)
exportJSON
=
Export Excel Label
(PubTabNet)
PPOCRLabel/resources/strings/strings-zh-CN.properties
浏览文件 @
e41dfc6e
...
...
@@ -84,7 +84,7 @@ mhelp=帮助
iconList
=
缩略图
detectionBoxposition
=
检测框位置
recognitionResult
=
识别结果
creatPolygon
=
多
边形
标注
creatPolygon
=
多
点
标注
drawSquares
=
正方形标注
rotateLeft
=
图片左旋转90度
rotateRight
=
图片右旋转90度
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录