Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
3a2c722d
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
接近 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
“8a2cf0fbffbe1becd626d6ec3f31740540807b20”上不存在“paddle/fluid/framework/dim_test.cu”
提交
3a2c722d
编写于
5月 08, 2021
作者:
H
Hui Zhang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix dev & test dataset filter
上级
b69021f9
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
28 addition
and
2 deletion
+28
-2
deepspeech/exps/deepspeech2/model.py
deepspeech/exps/deepspeech2/model.py
+13
-1
deepspeech/exps/u2/model.py
deepspeech/exps/u2/model.py
+13
-1
examples/librispeech/s0/local/data.sh
examples/librispeech/s0/local/data.sh
+1
-0
examples/librispeech/s1/local/data.sh
examples/librispeech/s1/local/data.sh
+1
-0
未找到文件。
deepspeech/exps/deepspeech2/model.py
浏览文件 @
3a2c722d
...
...
@@ -144,6 +144,12 @@ class DeepSpeech2Trainer(Trainer):
config
.
data
.
manifest
=
config
.
data
.
dev_manifest
config
.
data
.
augmentation_config
=
""
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
dev_dataset
=
ManifestDataset
.
from_config
(
config
)
if
self
.
parallel
:
...
...
@@ -320,9 +326,15 @@ class DeepSpeech2Tester(DeepSpeech2Trainer):
config
.
defrost
()
# return raw text
config
.
data
.
manifest
=
config
.
data
.
test_manifest
config
.
data
.
keep_transcription_text
=
True
config
.
data
.
augmentation_config
=
""
config
.
data
.
manifest
=
config
.
data
.
test_manifest
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
test_dataset
=
ManifestDataset
.
from_config
(
config
)
# return text ord id
...
...
deepspeech/exps/u2/model.py
浏览文件 @
3a2c722d
...
...
@@ -215,8 +215,14 @@ class U2Trainer(Trainer):
config
.
data
.
manifest
=
config
.
data
.
train_manifest
train_dataset
=
ManifestDataset
.
from_config
(
config
)
config
.
data
.
manifest
=
config
.
data
.
dev_manifest
config
.
data
.
augmentation_config
=
""
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
config
.
data
.
manifest
=
config
.
data
.
dev_manifest
dev_dataset
=
ManifestDataset
.
from_config
(
config
)
collate_fn
=
SpeechCollator
(
keep_transcription_text
=
False
)
...
...
@@ -253,6 +259,12 @@ class U2Trainer(Trainer):
# test dataset, return raw text
config
.
data
.
keep_transcription_text
=
True
config
.
data
.
augmentation_config
=
""
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
config
.
data
.
manifest
=
config
.
data
.
test_manifest
test_dataset
=
ManifestDataset
.
from_config
(
config
)
# return text ord id
...
...
examples/librispeech/s0/local/data.sh
浏览文件 @
3a2c722d
...
...
@@ -27,6 +27,7 @@ if [ ${stage} -le -1 ] && [ ${stop_stage} -ge -1 ]; then
mv
data/manifest.
${
set
}
data/manifest.
${
set
}
.raw
done
rm
-rf
data/manifest.train.raw data/manifest.dev.raw data/manifest.test.raw
for
set
in
train-clean-100 train-clean-360 train-other-500
;
do
cat
data/manifest.
${
set
}
.raw
>>
data/manifest.train.raw
done
...
...
examples/librispeech/s1/local/data.sh
浏览文件 @
3a2c722d
...
...
@@ -31,6 +31,7 @@ if [ ${stage} -le -1 ] && [ ${stop_stage} -ge -1 ]; then
mv
data/manifest.
${
set
}
data/manifest.
${
set
}
.raw
done
rm
-rf
data/manifest.train.raw data/manifest.dev.raw data/manifest.test.raw
for
set
in
train-clean-100 train-clean-360 train-other-500
;
do
cat
data/manifest.
${
set
}
.raw
>>
data/manifest.train.raw
done
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录