Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
93670ab5
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
93670ab5
编写于
1月 19, 2021
作者:
T
tink2123
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
all ready
上级
297871d4
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
17 addition
and
7 deletion
+17
-7
configs/rec/rec_r50_fpn_srn.yml
configs/rec/rec_r50_fpn_srn.yml
+5
-4
ppocr/modeling/heads/self_attention.py
ppocr/modeling/heads/self_attention.py
+1
-0
ppocr/postprocess/rec_postprocess.py
ppocr/postprocess/rec_postprocess.py
+4
-3
tools/program.py
tools/program.py
+7
-0
未找到文件。
configs/rec/rec_r50_fpn_srn.yml
浏览文件 @
93670ab5
...
...
@@ -3,7 +3,7 @@ Global:
epoch_num
:
72
log_smooth_window
:
20
print_batch_step
:
5
save_model_dir
:
./output/rec/srn
save_model_dir
:
./output/rec/srn
_new
save_epoch_step
:
3
# evaluation is run every 5000 iterations after the 4000th iteration
eval_batch_step
:
[
0
,
5000
]
...
...
@@ -25,8 +25,10 @@ Global:
Optimizer
:
name
:
Adam
beta1
:
0.9
beta2
:
0.999
clip_norm
:
10.0
lr
:
name
:
Cosine
learning_rate
:
0.0001
Architecture
:
...
...
@@ -58,7 +60,6 @@ Train:
dataset
:
name
:
LMDBDataSet
data_dir
:
./train_data/srn_train_data_duiqi
#label_file_list: ["./train_data/ic15_data/1.txt"]
transforms
:
-
DecodeImage
:
# load image
img_mode
:
BGR
...
...
@@ -77,7 +78,7 @@ Train:
loader
:
shuffle
:
False
batch_size_per_card
:
64
drop_last
:
Tru
e
drop_last
:
Fals
e
num_workers
:
4
Eval
:
...
...
ppocr/modeling/heads/self_attention.py
浏览文件 @
93670ab5
...
...
@@ -359,6 +359,7 @@ class PrepareDecoder(nn.Layer):
self
.
emb0
=
paddle
.
nn
.
Embedding
(
num_embeddings
=
src_vocab_size
,
embedding_dim
=
self
.
src_emb_dim
,
padding_idx
=
bos_idx
,
weight_attr
=
paddle
.
ParamAttr
(
name
=
word_emb_param_name
,
initializer
=
nn
.
initializer
.
Normal
(
0.
,
src_emb_dim
**-
0.5
)))
...
...
ppocr/postprocess/rec_postprocess.py
浏览文件 @
93670ab5
...
...
@@ -182,14 +182,15 @@ class SRNLabelDecode(BaseRecLabelDecode):
preds_prob
=
np
.
reshape
(
preds_prob
,
[
-
1
,
25
])
text
=
self
.
decode
(
preds_idx
,
preds_prob
)
text
=
self
.
decode
(
preds_idx
,
preds_prob
,
is_remove_duplicate
=
True
)
if
label
is
None
:
text
=
self
.
decode
(
preds_idx
,
preds_prob
,
is_remove_duplicate
=
False
)
return
text
label
=
self
.
decode
(
label
,
is_remove_duplicate
=
Fals
e
)
label
=
self
.
decode
(
label
,
is_remove_duplicate
=
Tru
e
)
return
text
,
label
def
decode
(
self
,
text_index
,
text_prob
=
None
,
is_remove_duplicate
=
Tru
e
):
def
decode
(
self
,
text_index
,
text_prob
=
None
,
is_remove_duplicate
=
Fals
e
):
""" convert text-index into text-label. """
result_list
=
[]
ignored_tokens
=
self
.
get_ignored_tokens
()
...
...
tools/program.py
浏览文件 @
93670ab5
...
...
@@ -242,6 +242,12 @@ def train(config,
# eval
if
global_step
>
start_eval_step
and
\
(
global_step
-
start_eval_step
)
%
eval_batch_step
==
0
and
dist
.
get_rank
()
==
0
:
model_average
=
paddle
.
optimizer
.
ModelAverage
(
0.15
,
parameters
=
model
.
parameters
(),
min_average_window
=
10000
,
max_average_window
=
15625
)
model_average
.
apply
()
cur_metirc
=
eval
(
model
,
valid_dataloader
,
post_process_class
,
eval_class
)
cur_metirc_str
=
'cur metirc, {}'
.
format
(
', '
.
join
(
...
...
@@ -277,6 +283,7 @@ def train(config,
best_model_dict
[
main_indicator
],
global_step
)
global_step
+=
1
optimizer
.
clear_grad
()
batch_start
=
time
.
time
()
if
dist
.
get_rank
()
==
0
:
save_model
(
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录