Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
4b225b76
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
1 年多 前同步成功
通知
207
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
4b225b76
编写于
9月 26, 2021
作者:
J
Jackwaterveg
提交者:
GitHub
9月 26, 2021
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #858 from PaddlePaddle/ctc
ctc using nn.Dropout; ds2 libri vald batch_size / 4
上级
88a19897
9abf03bb
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
8 addition
and
8 deletion
+8
-8
deepspeech/exps/deepspeech2/model.py
deepspeech/exps/deepspeech2/model.py
+1
-1
deepspeech/modules/ctc.py
deepspeech/modules/ctc.py
+2
-2
deepspeech/modules/loss.py
deepspeech/modules/loss.py
+2
-2
examples/librispeech/s1/conf/transformer.yaml
examples/librispeech/s1/conf/transformer.yaml
+3
-3
未找到文件。
deepspeech/exps/deepspeech2/model.py
浏览文件 @
4b225b76
...
...
@@ -235,7 +235,7 @@ class DeepSpeech2Trainer(Trainer):
num_workers
=
config
.
collator
.
num_workers
)
self
.
valid_loader
=
DataLoader
(
dev_dataset
,
batch_size
=
config
.
collator
.
batch_size
,
batch_size
=
int
(
config
.
collator
.
batch_size
/
4
)
,
shuffle
=
False
,
drop_last
=
False
,
collate_fn
=
collate_fn_dev
)
...
...
deepspeech/modules/ctc.py
浏览文件 @
4b225b76
...
...
@@ -56,7 +56,7 @@ class CTCDecoder(nn.Layer):
self
.
blank_id
=
blank_id
self
.
odim
=
odim
self
.
dropout
_rate
=
dropout_rate
self
.
dropout
=
nn
.
Dropout
(
dropout_rate
)
self
.
ctc_lo
=
nn
.
Linear
(
enc_n_units
,
self
.
odim
)
reduction_type
=
"sum"
if
reduction
else
"none"
self
.
criterion
=
CTCLoss
(
...
...
@@ -79,7 +79,7 @@ class CTCDecoder(nn.Layer):
Returns:
loss (Tenosr): ctc loss value, scalar.
"""
logits
=
self
.
ctc_lo
(
F
.
dropout
(
hs_pad
,
p
=
self
.
dropout_rate
))
logits
=
self
.
ctc_lo
(
self
.
dropout
(
hs_pad
))
loss
=
self
.
criterion
(
logits
,
ys_pad
,
hlens
,
ys_lens
)
return
loss
...
...
deepspeech/modules/loss.py
浏览文件 @
4b225b76
...
...
@@ -45,9 +45,9 @@ class CTCLoss(nn.Layer):
logger
.
info
(
f
"CTCLoss Grad Norm Type:
{
grad_norm_type
}
"
)
if
grad_norm_type
==
'instance'
:
self
.
norm_by_times
=
True
if
grad_norm_type
==
'batch'
:
el
if
grad_norm_type
==
'batch'
:
self
.
norm_by_batchsize
=
True
if
grad_norm_type
==
'frame'
:
el
if
grad_norm_type
==
'frame'
:
self
.
norm_by_total_logits_len
=
True
def
forward
(
self
,
logits
,
ys_pad
,
hlens
,
ys_lens
):
...
...
examples/librispeech/s1/conf/transformer.yaml
浏览文件 @
4b225b76
...
...
@@ -8,7 +8,7 @@ data:
min_output_len
:
0.0
# tokens
max_output_len
:
400.0
# tokens
min_output_input_ratio
:
0.05
max_output_input_ratio
:
10.0
max_output_input_ratio
:
10
0
.0
collator
:
vocab_filepath
:
data/vocab.txt
...
...
@@ -16,7 +16,7 @@ collator:
spm_model_prefix
:
'
data/bpe_unigram_5000'
mean_std_filepath
:
"
"
augmentation_config
:
conf/augmentation.json
batch_size
:
64
batch_size
:
32
raw_wav
:
True
# use raw_wav or kaldi feature
specgram_type
:
fbank
#linear, mfcc, fbank
feat_dim
:
80
...
...
@@ -75,7 +75,7 @@ model:
training
:
n_epoch
:
120
accum_grad
:
2
accum_grad
:
4
global_grad_clip
:
5.0
optim
:
adam
optim_conf
:
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录