Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
4d816b61
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
4d816b61
编写于
9月 18, 2020
作者:
T
tink2123
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
make label for paddleocr
上级
d31effaf
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
63 addition
and
0 deletion
+63
-0
train_data/gen_label.py
train_data/gen_label.py
+63
-0
未找到文件。
train_data/gen_label.py
0 → 100644
浏览文件 @
4d816b61
import
os
import
argparse
def
gen_rec_label
(
input_path
,
out_label
):
out_file
=
open
(
out_label
,
'w'
)
with
open
(
input_path
,
'r'
)
as
f
:
for
line
in
f
.
readlines
():
tmp
=
line
.
strip
(
'
\n
'
).
replace
(
" "
,
""
).
split
(
','
)
img_path
,
label
=
tmp
[
0
],
tmp
[
1
]
label
=
label
.
replace
(
"
\"
"
,
""
)
out_file
.
write
(
img_path
+
'
\t
'
+
label
+
'
\n
'
)
out_file
.
close
()
def
gen_det_label
(
input_dir
,
out_label
):
root_path
=
""
if
"training"
in
input_dir
:
root_path
=
"icdar_c4_train_imgs/"
elif
"test"
in
input_dir
:
root_path
=
"ch4_test_images/"
out_file
=
open
(
out_label
,
'w'
)
for
label_file
in
os
.
listdir
(
input_dir
):
img_path
=
root_path
+
label_file
[
3
:
-
4
]
+
".jpg"
label
=
[]
with
open
(
os
.
path
.
join
(
input_dir
,
label_file
),
'r'
)
as
f
:
for
line
in
f
.
readlines
():
tmp
=
line
.
strip
(
"
\n\r
"
).
replace
(
"
\xef\xbb\xbf
"
,
""
).
split
(
','
)
points
=
tmp
[:
-
2
]
s
=
[]
for
i
in
range
(
0
,
len
(
points
),
2
):
b
=
points
[
i
:
i
+
2
]
s
.
append
(
b
)
result
=
{
"transcription"
:
tmp
[
-
1
],
"points"
:
s
}
label
.
append
(
result
)
out_file
.
write
(
img_path
+
'
\t
'
+
str
(
label
)
+
'
\n
'
)
out_file
.
close
()
if
__name__
==
"__main__"
:
parser
=
argparse
.
ArgumentParser
()
parser
.
add_argument
(
'--mode'
,
type
=
str
,
default
=
"rec"
,
help
=
'Generate rec_label or det_label, can be set rec or det'
)
parser
.
add_argument
(
'--input_path'
,
type
=
str
,
default
=
"."
,
help
=
'Input_label or input path to be converted'
)
parser
.
add_argument
(
'--output_label'
,
type
=
str
,
default
=
"out_label.txt"
,
help
=
'Output file name'
)
args
=
parser
.
parse_args
()
if
args
.
mode
==
"rec"
:
print
(
"Generate rec label"
)
gen_rec_label
(
args
.
input_path
,
args
.
output_label
)
elif
args
.
mode
==
"det"
:
gen_det_label
(
args
.
input_path
,
args
.
output_label
)
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录