Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
1c3d2cb8
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
1c3d2cb8
编写于
11月 21, 2022
作者:
D
David An (An Hongliang)
提交者:
GitHub
11月 21, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add double byte char for zh normalization (#2661)
上级
94a487bd
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
14 addition
and
3 deletion
+14
-3
paddlespeech/t2s/frontend/zh_normalization/constants.py
paddlespeech/t2s/frontend/zh_normalization/constants.py
+3
-3
paddlespeech/t2s/frontend/zh_normalization/text_normlization.py
...speech/t2s/frontend/zh_normalization/text_normlization.py
+11
-0
未找到文件。
paddlespeech/t2s/frontend/zh_normalization/constants.py
浏览文件 @
1c3d2cb8
...
...
@@ -19,7 +19,7 @@ from pypinyin.constants import SUPPORT_UCS4
# 全角半角转换
# 英文字符全角 -> 半角映射表 (num: 52)
F2H_ASCII_LETTERS
=
{
chr
(
ord
(
char
)
+
65248
):
char
ord
(
char
)
+
65248
:
ord
(
char
)
for
char
in
string
.
ascii_letters
}
...
...
@@ -27,12 +27,12 @@ F2H_ASCII_LETTERS = {
H2F_ASCII_LETTERS
=
{
value
:
key
for
key
,
value
in
F2H_ASCII_LETTERS
.
items
()}
# 数字字符全角 -> 半角映射表 (num: 10)
F2H_DIGITS
=
{
chr
(
ord
(
char
)
+
65248
):
char
for
char
in
string
.
digits
}
F2H_DIGITS
=
{
ord
(
char
)
+
65248
:
ord
(
char
)
for
char
in
string
.
digits
}
# 数字字符半角 -> 全角映射表
H2F_DIGITS
=
{
value
:
key
for
key
,
value
in
F2H_DIGITS
.
items
()}
# 标点符号全角 -> 半角映射表 (num: 32)
F2H_PUNCTUATIONS
=
{
chr
(
ord
(
char
)
+
65248
):
char
for
char
in
string
.
punctuation
}
F2H_PUNCTUATIONS
=
{
ord
(
char
)
+
65248
:
ord
(
char
)
for
char
in
string
.
punctuation
}
# 标点符号半角 -> 全角映射表
H2F_PUNCTUATIONS
=
{
value
:
key
for
key
,
value
in
F2H_PUNCTUATIONS
.
items
()}
...
...
paddlespeech/t2s/frontend/zh_normalization/text_normlization.py
浏览文件 @
1c3d2cb8
...
...
@@ -74,6 +74,17 @@ class TextNormalizer():
def
_post_replace
(
self
,
sentence
:
str
)
->
str
:
sentence
=
sentence
.
replace
(
'/'
,
'每'
)
sentence
=
sentence
.
replace
(
'~'
,
'至'
)
sentence
=
sentence
.
replace
(
'~'
,
'至'
)
sentence
=
sentence
.
replace
(
'①'
,
'一'
)
sentence
=
sentence
.
replace
(
'②'
,
'二'
)
sentence
=
sentence
.
replace
(
'③'
,
'三'
)
sentence
=
sentence
.
replace
(
'④'
,
'四'
)
sentence
=
sentence
.
replace
(
'⑤'
,
'五'
)
sentence
=
sentence
.
replace
(
'⑥'
,
'六'
)
sentence
=
sentence
.
replace
(
'⑦'
,
'七'
)
sentence
=
sentence
.
replace
(
'⑧'
,
'八'
)
sentence
=
sentence
.
replace
(
'⑨'
,
'九'
)
sentence
=
sentence
.
replace
(
'⑩'
,
'十'
)
return
sentence
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录