Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
a84b40ef
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
a84b40ef
编写于
8月 12, 2022
作者:
B
BarryKCL
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update g2pW dict
上级
6593c249
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
27 addition
and
4 deletion
+27
-4
paddlespeech/resource/pretrained_models.py
paddlespeech/resource/pretrained_models.py
+1
-1
paddlespeech/t2s/frontend/g2pw/onnx_api.py
paddlespeech/t2s/frontend/g2pw/onnx_api.py
+4
-2
paddlespeech/t2s/frontend/polyphonic.yaml
paddlespeech/t2s/frontend/polyphonic.yaml
+22
-1
未找到文件。
paddlespeech/resource/pretrained_models.py
浏览文件 @
a84b40ef
...
@@ -1345,7 +1345,7 @@ g2pw_onnx_models = {
...
@@ -1345,7 +1345,7 @@ g2pw_onnx_models = {
'url'
:
'url'
:
'https://paddlespeech.bj.bcebos.com/Parakeet/released_models/g2p/G2PWModel.tar'
,
'https://paddlespeech.bj.bcebos.com/Parakeet/released_models/g2p/G2PWModel.tar'
,
'md5'
:
'md5'
:
'
86a3dd8db0291c575c46e134111dce23
'
,
'
63bc0894af15a5a591e58b2130a2bcac
'
,
},
},
},
},
}
}
paddlespeech/t2s/frontend/g2pw/onnx_api.py
浏览文件 @
a84b40ef
...
@@ -8,7 +8,7 @@ import onnxruntime
...
@@ -8,7 +8,7 @@ import onnxruntime
import
numpy
as
np
import
numpy
as
np
from
opencc
import
OpenCC
from
opencc
import
OpenCC
from
pypinyin
import
pinyin
,
lazy_pinyin
,
Style
from
paddlenlp.transformers
import
BertTokenizer
from
paddlenlp.transformers
import
BertTokenizer
from
paddlespeech.utils.env
import
MODEL_HOME
from
paddlespeech.utils.env
import
MODEL_HOME
from
paddlespeech.t2s.frontend.g2pw.dataset
import
prepare_data
,
\
from
paddlespeech.t2s.frontend.g2pw.dataset
import
prepare_data
,
\
...
@@ -127,6 +127,7 @@ class G2PWOnnxConverter:
...
@@ -127,6 +127,7 @@ class G2PWOnnxConverter:
}
}
texts
,
query_ids
,
sent_ids
,
partial_results
=
[],
[],
[],
[]
texts
,
query_ids
,
sent_ids
,
partial_results
=
[],
[],
[],
[]
for
sent_id
,
sent
in
enumerate
(
sentences
):
for
sent_id
,
sent
in
enumerate
(
sentences
):
pypinyin_result
=
pinyin
(
sent
,
style
=
Style
.
TONE3
)
partial_result
=
[
None
]
*
len
(
sent
)
partial_result
=
[
None
]
*
len
(
sent
)
for
i
,
char
in
enumerate
(
sent
):
for
i
,
char
in
enumerate
(
sent
):
if
char
in
polyphonic_chars
:
if
char
in
polyphonic_chars
:
...
@@ -136,6 +137,7 @@ class G2PWOnnxConverter:
...
@@ -136,6 +137,7 @@ class G2PWOnnxConverter:
elif
char
in
monophonic_chars_dict
:
elif
char
in
monophonic_chars_dict
:
partial_result
[
i
]
=
self
.
style_convert_func
(
monophonic_chars_dict
[
char
])
partial_result
[
i
]
=
self
.
style_convert_func
(
monophonic_chars_dict
[
char
])
elif
char
in
self
.
char_bopomofo_dict
:
elif
char
in
self
.
char_bopomofo_dict
:
partial_result
[
i
]
=
self
.
style_convert_func
(
self
.
char_bopomofo_dict
[
char
][
0
])
partial_result
[
i
]
=
pypinyin_result
[
i
][
0
]
# partial_result[i] = self.style_convert_func(self.char_bopomofo_dict[char][0])
partial_results
.
append
(
partial_result
)
partial_results
.
append
(
partial_result
)
return
texts
,
query_ids
,
sent_ids
,
partial_results
return
texts
,
query_ids
,
sent_ids
,
partial_results
paddlespeech/t2s/frontend/polyphonic.yaml
浏览文件 @
a84b40ef
polyphonic
:
polyphonic
:
湖泊
:
[
'
hu2'
,
'
po1'
]
湖泊
:
[
'
hu2'
,
'
po1'
]
地壳
:
[
'
di4'
,
'
qiao4'
]
柏树
:
[
'
bai3'
,
'
shu4'
]
曝光
:
[
'
bao4'
,
'
guang1'
]
弹力
:
[
'
tan2'
,
'
li4'
]
弹力
:
[
'
tan2'
,
'
li4'
]
字帖
:
[
'
zi4'
,
'
tie4'
]
口吃
:
[
'
kou3'
,
'
chi1'
]
包扎
:
[
'
bao1'
,
'
za1'
]
哪吒
:
[
'
ne2'
,
'
zha1'
]
说服
:
[
'
shuo1'
,
'
fu2'
]
识字
:
[
'
shi2'
,
'
zi4'
]
骨头
:
[
'
gu3'
,
'
tou5'
]
对称
:
[
'
dui4'
,
'
chen4'
]
口供
:
[
'
kou3'
,
'
gong4'
]
抹布
:
[
'
ma1'
,
'
bu4'
]
露背
:
[
'
lu4'
,
'
bei4'
]
圈养
:
[
'
juan4'
,
'
yang3'
]
眼眶
:
[
'
yan3'
,
'
kuang4'
]
品行
:
[
'
pin3'
,
'
xing2'
]
颤抖
:
[
'
chan4'
,
'
dou3'
]
颤抖
:
[
'
chan4'
,
'
dou3'
]
差不多
:
[
'
cha4'
,
'
bu5'
,
'
duo1'
]
鸭绿江
:
[
'
ya1'
,
'
lu4'
,
'
jiang1'
]
鸭绿江
:
[
'
ya1'
,
'
lu4'
,
'
jiang1'
]
撒切尔
:
[
'
sa4'
,
'
qie4'
,
'
er3'
]
比比皆是
:
[
'
bi3'
,
'
bi3'
,
'
jie1'
,
'
shi4'
]
身无长物
:
[
'
shen1'
,
'
wu2'
,
'
chang2'
,
'
wu4'
]
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录