Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
ede001e8
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
接近 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
ede001e8
编写于
5月 08, 2021
作者:
H
Hui Zhang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix dataset filter
上级
3a2c722d
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
22 addition
and
22 deletion
+22
-22
deepspeech/exps/deepspeech2/model.py
deepspeech/exps/deepspeech2/model.py
+10
-10
deepspeech/exps/u2/model.py
deepspeech/exps/u2/model.py
+12
-12
未找到文件。
deepspeech/exps/deepspeech2/model.py
浏览文件 @
ede001e8
...
...
@@ -145,11 +145,11 @@ class DeepSpeech2Trainer(Trainer):
config
.
data
.
manifest
=
config
.
data
.
dev_manifest
config
.
data
.
augmentation_config
=
""
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
config
.
data
.
max_input_len
=
float
(
'inf'
)
# second
config
.
data
.
min_output_len
=
0.0
# tokens
config
.
data
.
max_output_len
=
float
(
'inf'
)
# tokens
config
.
data
.
min_output_input_ratio
=
0.00
config
.
data
.
max_output_input_ratio
=
float
(
'inf'
)
dev_dataset
=
ManifestDataset
.
from_config
(
config
)
if
self
.
parallel
:
...
...
@@ -330,11 +330,11 @@ class DeepSpeech2Tester(DeepSpeech2Trainer):
config
.
data
.
keep_transcription_text
=
True
config
.
data
.
augmentation_config
=
""
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
config
.
data
.
max_input_len
=
float
(
'inf'
)
# second
config
.
data
.
min_output_len
=
0.0
# tokens
config
.
data
.
max_output_len
=
float
(
'inf'
)
# tokens
config
.
data
.
min_output_input_ratio
=
0.00
config
.
data
.
max_output_input_ratio
=
float
(
'inf'
)
test_dataset
=
ManifestDataset
.
from_config
(
config
)
# return text ord id
...
...
deepspeech/exps/u2/model.py
浏览文件 @
ede001e8
...
...
@@ -215,14 +215,14 @@ class U2Trainer(Trainer):
config
.
data
.
manifest
=
config
.
data
.
train_manifest
train_dataset
=
ManifestDataset
.
from_config
(
config
)
config
.
data
.
manifest
=
config
.
data
.
dev_manifest
config
.
data
.
augmentation_config
=
""
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
config
.
data
.
manifest
=
config
.
data
.
dev_manifest
config
.
data
.
max_input_len
=
float
(
'inf'
)
# second
config
.
data
.
min_output_len
=
0.0
# tokens
config
.
data
.
max_output_len
=
float
(
'inf'
)
# tokens
config
.
data
.
min_output_input_ratio
=
0.00
config
.
data
.
max_output_input_ratio
=
float
(
'inf'
)
dev_dataset
=
ManifestDataset
.
from_config
(
config
)
collate_fn
=
SpeechCollator
(
keep_transcription_text
=
False
)
...
...
@@ -257,15 +257,15 @@ class U2Trainer(Trainer):
collate_fn
=
collate_fn
)
# test dataset, return raw text
config
.
data
.
manifest
=
config
.
data
.
test_manifest
config
.
data
.
keep_transcription_text
=
True
config
.
data
.
augmentation_config
=
""
config
.
data
.
min_input_len
=
0.0
# second
config
.
data
.
max_input_len
:
100.0
# second
config
.
data
.
min_output_len
:
0.0
# tokens
config
.
data
.
max_output_len
:
400.0
# tokens
config
.
data
.
min_output_input_ratio
:
0.00
config
.
data
.
max_output_input_ratio
:
100.0
config
.
data
.
manifest
=
config
.
data
.
test_manifest
config
.
data
.
max_input_len
=
float
(
'inf'
)
# second
config
.
data
.
min_output_len
=
0.0
# tokens
config
.
data
.
max_output_len
=
float
(
'inf'
)
# tokens
config
.
data
.
min_output_input_ratio
=
0.00
config
.
data
.
max_output_input_ratio
=
float
(
'inf'
)
test_dataset
=
ManifestDataset
.
from_config
(
config
)
# return text ord id
self
.
test_loader
=
DataLoader
(
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录