Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
e6c62504
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
e6c62504
编写于
8月 24, 2022
作者:
M
MissPenguin
提交者:
GitHub
8月 24, 2022
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #7208 from Topdu/dygraph
update arabic rec model & add pred reverse function
上级
9479813d
1a5e1be1
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
26 addition
and
2 deletion
+26
-2
configs/rec/PP-OCRv3/multi_language/arabic_PP-OCRv3_rec.yml
configs/rec/PP-OCRv3/multi_language/arabic_PP-OCRv3_rec.yml
+1
-1
ppocr/postprocess/rec_postprocess.py
ppocr/postprocess/rec_postprocess.py
+25
-0
ppocr/utils/dict/arabic_dict.txt
ppocr/utils/dict/arabic_dict.txt
+0
-1
未找到文件。
configs/rec/PP-OCRv3/multi_language/arabic_PP-OCRv3_rec.yml
浏览文件 @
e6c62504
...
@@ -12,7 +12,7 @@ Global:
...
@@ -12,7 +12,7 @@ Global:
checkpoints
:
checkpoints
:
save_inference_dir
:
save_inference_dir
:
use_visualdl
:
false
use_visualdl
:
false
infer_img
:
doc/imgs_words/ch/word_1
.jpg
infer_img
:
./doc/imgs_words/arabic/ar_2
.jpg
character_dict_path
:
ppocr/utils/dict/arabic_dict.txt
character_dict_path
:
ppocr/utils/dict/arabic_dict.txt
max_text_length
:
&max_text_length
25
max_text_length
:
&max_text_length
25
infer_mode
:
false
infer_mode
:
false
...
...
ppocr/postprocess/rec_postprocess.py
浏览文件 @
e6c62504
...
@@ -45,6 +45,27 @@ class BaseRecLabelDecode(object):
...
@@ -45,6 +45,27 @@ class BaseRecLabelDecode(object):
self
.
dict
[
char
]
=
i
self
.
dict
[
char
]
=
i
self
.
character
=
dict_character
self
.
character
=
dict_character
if
'arabic'
in
character_dict_path
:
self
.
reverse
=
True
else
:
self
.
reverse
=
False
def
pred_reverse
(
self
,
pred
):
pred_re
=
[]
c_current
=
''
for
c
in
pred
:
if
not
bool
(
re
.
search
(
'[a-zA-Z0-9 :*./%+-]'
,
c
)):
if
c_current
!=
''
:
pred_re
.
append
(
c_current
)
pred_re
.
append
(
c
)
c_current
=
''
else
:
c_current
+=
c
if
c_current
!=
''
:
pred_re
.
append
(
c_current
)
return
''
.
join
(
pred_re
[::
-
1
])
def
add_special_char
(
self
,
dict_character
):
def
add_special_char
(
self
,
dict_character
):
return
dict_character
return
dict_character
...
@@ -73,6 +94,10 @@ class BaseRecLabelDecode(object):
...
@@ -73,6 +94,10 @@ class BaseRecLabelDecode(object):
conf_list
=
[
0
]
conf_list
=
[
0
]
text
=
''
.
join
(
char_list
)
text
=
''
.
join
(
char_list
)
if
self
.
reverse
:
# for arabic rec
text
=
self
.
pred_reverse
(
text
)
result_list
.
append
((
text
,
np
.
mean
(
conf_list
).
tolist
()))
result_list
.
append
((
text
,
np
.
mean
(
conf_list
).
tolist
()))
return
result_list
return
result_list
...
...
ppocr/utils/dict/arabic_dict.txt
浏览文件 @
e6c62504
!
!
#
#
$
$
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录