Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
d42eb4ff
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
d42eb4ff
编写于
8月 27, 2020
作者:
S
shaohua.zhang
提交者:
GitHub
8月 27, 2020
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix some bugs
上级
efa97b69
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
7 addition
and
11 deletion
+7
-11
ppocr/data/rec/dataset_traversal.py
ppocr/data/rec/dataset_traversal.py
+7
-11
未找到文件。
ppocr/data/rec/dataset_traversal.py
浏览文件 @
d42eb4ff
...
@@ -13,20 +13,16 @@
...
@@ -13,20 +13,16 @@
#limitations under the License.
#limitations under the License.
import
os
import
os
import
sys
import
math
import
random
import
random
import
numpy
as
np
import
sys
import
cv2
import
string
import
cv2
import
lmdb
import
lmdb
from
ppocr.utils.utility
import
initial_logger
from
ppocr.utils.utility
import
get_image_file_list
from
ppocr.utils.utility
import
get_image_file_list
logger
=
initial_logger
()
from
ppocr.utils.utility
import
initial_logger
from
.img_tools
import
process_image
,
process_image_srn
,
get_img_data
from
.img_tools
import
process_image
,
process_image_srn
,
get_img_data
logger
=
initial_logger
()
class
LMDBReader
(
object
):
class
LMDBReader
(
object
):
...
@@ -268,7 +264,7 @@ class SimpleReader(object):
...
@@ -268,7 +264,7 @@ class SimpleReader(object):
infer_mode
=
True
)
infer_mode
=
True
)
yield
norm_img
yield
norm_img
else
:
else
:
with
open
(
self
.
label_file_path
,
"r
b
"
)
as
fin
:
with
open
(
self
.
label_file_path
,
"r
"
,
encoding
=
"utf-8
"
)
as
fin
:
label_infor_list
=
fin
.
readlines
()
label_infor_list
=
fin
.
readlines
()
img_num
=
len
(
label_infor_list
)
img_num
=
len
(
label_infor_list
)
img_id_list
=
list
(
range
(
img_num
))
img_id_list
=
list
(
range
(
img_num
))
...
@@ -285,8 +281,8 @@ class SimpleReader(object):
...
@@ -285,8 +281,8 @@ class SimpleReader(object):
self
.
num_workers
))
self
.
num_workers
))
for
img_id
in
range
(
process_id
,
img_num
,
self
.
num_workers
):
for
img_id
in
range
(
process_id
,
img_num
,
self
.
num_workers
):
label_infor
=
label_infor_list
[
img_id_list
[
img_id
]]
label_infor
=
label_infor_list
[
img_id_list
[
img_id
]]
substr
=
label_infor
.
decode
(
'utf-8'
).
strip
(
"
\n
"
).
split
(
"
\t
"
)
substr
=
label_infor
.
strip
(
"
\n
"
).
strip
().
split
(
)
img_path
=
self
.
img_set_dir
+
"/"
+
substr
[
0
]
img_path
=
os
.
path
.
join
(
self
.
img_set_dir
,
substr
[
0
])
img
=
cv2
.
imread
(
img_path
)
img
=
cv2
.
imread
(
img_path
)
if
img
is
None
:
if
img
is
None
:
logger
.
info
(
"{} does not exist!"
.
format
(
img_path
))
logger
.
info
(
"{} does not exist!"
.
format
(
img_path
))
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录