Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
37cd4ed3
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
37cd4ed3
编写于
9月 02, 2021
作者:
A
andyjpaddle
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
delete dict90, update sar postprocess, update sar.yml
上级
ea019601
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
10 addition
and
97 deletion
+10
-97
configs/rec/rec_r31_sar.yml
configs/rec/rec_r31_sar.yml
+5
-4
ppocr/postprocess/rec_postprocess.py
ppocr/postprocess/rec_postprocess.py
+5
-3
ppocr/utils/dict90.txt
ppocr/utils/dict90.txt
+0
-90
未找到文件。
configs/rec/rec_r31_sar.yml
浏览文件 @
37cd4ed3
...
...
@@ -15,7 +15,7 @@ Global:
infer_img
:
# for data or label process
character_dict_path
:
ppocr/utils/dict90.txt
character_type
:
ch
character_type
:
EN_symbol
max_text_length
:
30
infer_mode
:
False
use_space_char
:
False
...
...
@@ -47,6 +47,7 @@ Loss:
PostProcess
:
name
:
SARLabelDecode
rm_symbol
:
True
Metric
:
name
:
RecMetric
...
...
@@ -56,8 +57,8 @@ Train:
dataset
:
name
:
SimpleDataSet
delimiter
:
'
'
label_file_list
:
[
'
/paddle/data/concat
_data/train_list.txt'
]
data_dir
:
/paddle/data/concat
_data/
label_file_list
:
[
'
./train
_data/train_list.txt'
]
data_dir
:
./train
_data/
ratio_list
:
1.0
transforms
:
-
DecodeImage
:
# load image
...
...
@@ -79,7 +80,7 @@ Train:
Eval
:
dataset
:
name
:
LMDBDataSet
data_dir
:
/paddle/data/ocr
_data/evaluation/
data_dir
:
./eval
_data/evaluation/
transforms
:
-
DecodeImage
:
# load image
img_mode
:
BGR
...
...
ppocr/postprocess/rec_postprocess.py
浏览文件 @
37cd4ed3
...
...
@@ -526,6 +526,7 @@ class SARLabelDecode(BaseRecLabelDecode):
character_dict_path
=
None
,
character_type
=
'ch'
,
use_space_char
=
False
,
rm_symbol
=
True
,
**
kwargs
):
super
(
SARLabelDecode
,
self
).
__init__
(
character_dict_path
,
character_type
,
use_space_char
)
...
...
@@ -572,6 +573,7 @@ class SARLabelDecode(BaseRecLabelDecode):
else
:
conf_list
.
append
(
1
)
text
=
''
.
join
(
char_list
)
if
self
.
rm_symbol
:
comp
=
re
.
compile
(
'[^A-Z^a-z^0-9^
\u4e00
-
\u9fa5
]'
)
text
=
text
.
lower
()
text
=
comp
.
sub
(
''
,
text
)
...
...
ppocr/utils/dict90.txt
已删除
100644 → 0
浏览文件 @
ea019601
0
1
2
3
4
5
6
7
8
9
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
!
"
#
$
%
&
'
(
)
*
+
,
-
.
/
:
;
<
=
>
?
@
[
\
]
_
`
~
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录