Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
8432e862
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
8432e862
编写于
5月 31, 2023
作者:
J
jiamingkong
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Final cleaning; Modified SSL/infer.py and README for wavlm inclusion in model options
上级
ba874db5
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
12 addition
and
6 deletion
+12
-6
demos/speech_ssl/README.md
demos/speech_ssl/README.md
+1
-1
demos/speech_ssl/README_cn.md
demos/speech_ssl/README_cn.md
+1
-1
examples/librispeech/asr5/run.sh
examples/librispeech/asr5/run.sh
+1
-1
paddlespeech/cli/ssl/infer.py
paddlespeech/cli/ssl/infer.py
+7
-1
paddlespeech/s2t/exps/wavlm/bin/test_wav.py
paddlespeech/s2t/exps/wavlm/bin/test_wav.py
+2
-2
未找到文件。
demos/speech_ssl/README.md
浏览文件 @
8432e862
...
...
@@ -36,7 +36,7 @@ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
```
Arguments:
-
`input`
(required): Audio file to recognize.
-
`model`
: Model type of asr task. Default:
`wav2vec2`
, choices: [wav2vec2, hubert].
-
`model`
: Model type of asr task. Default:
`wav2vec2`
, choices: [wav2vec2, hubert
, wavlm
].
-
`task`
: Output type. Default:
`asr`
.
-
`lang`
: Model language. Default:
`en`
.
-
`sample_rate`
: Sample rate of the model. Default:
`16000`
.
...
...
demos/speech_ssl/README_cn.md
浏览文件 @
8432e862
...
...
@@ -36,7 +36,7 @@ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
```
参数:
-
`input`
(必须输入):用于识别的音频文件。
-
`model`
:ASR 任务的模型,默认值:
`wav2vec2`
, 可选项:[wav2vec2, hubert]。
-
`model`
:ASR 任务的模型,默认值:
`wav2vec2`
, 可选项:[wav2vec2, hubert
, wavlm
]。
-
`task`
:输出类别,默认值:
`asr`
。
-
`lang`
:模型语言,默认值:
`en`
。
-
`sample_rate`
:音频采样率,默认值:
`16000`
。
...
...
examples/librispeech/asr5/run.sh
浏览文件 @
8432e862
...
...
@@ -4,7 +4,7 @@ set -e
.
./path.sh
||
exit
1
;
.
./cmd.sh
||
exit
1
;
gpus
=
1,2,3
gpus
=
0,1,2
stage
=
0
stop_stage
=
3
conf_path
=
conf/wavlmASR.yaml
...
...
paddlespeech/cli/ssl/infer.py
浏览文件 @
8432e862
...
...
@@ -52,7 +52,7 @@ class SSLExecutor(BaseExecutor):
'--model'
,
type
=
str
,
default
=
'wav2vec2'
,
choices
=
[
'wav2vec2'
,
'hubert'
],
choices
=
[
'wav2vec2'
,
'hubert'
,
"wavlm"
],
help
=
'Choose model type of asr task.'
)
self
.
parser
.
add_argument
(
'--task'
,
...
...
@@ -157,6 +157,12 @@ class SSLExecutor(BaseExecutor):
elif
lang
==
'zh'
:
logger
.
error
(
"zh hubertASR is not supported yet"
)
tag
=
model_prefix
+
'-'
+
lang
+
'-'
+
sample_rate_str
elif
model_type
==
'wavlm'
:
if
lang
==
"en"
:
model_prefix
=
"wavlmASR_librispeech"
elif
lang
==
"zh"
:
logger
.
error
(
"zh wavlmASR is not supported yet"
)
tag
=
model_prefix
+
'-'
+
lang
+
'-'
+
sample_rate_str
else
:
tag
=
model_type
+
'-'
+
lang
+
'-'
+
sample_rate_str
self
.
task_resource
.
set_task_model
(
tag
,
version
=
None
)
...
...
paddlespeech/s2t/exps/wavlm/bin/test_wav.py
浏览文件 @
8432e862
...
...
@@ -29,7 +29,7 @@ from paddlespeech.s2t.utils.utility import UpdateConfig
logger
=
Log
(
__name__
).
getlog
()
class
Wav
2vec2
Infer
():
class
Wav
LM
Infer
():
def
__init__
(
self
,
config
,
args
):
self
.
args
=
args
self
.
config
=
config
...
...
@@ -99,7 +99,7 @@ def check(audio_file):
def
main
(
config
,
args
):
Wav
2vec2
Infer
(
config
,
args
).
run
()
Wav
LM
Infer
(
config
,
args
).
run
()
if
__name__
==
"__main__"
:
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录