Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
c5d85a93
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
c5d85a93
编写于
5月 18, 2021
作者:
H
Hui Zhang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix libri ds2 scripts; add ngram and spm doc
上级
9f907b9b
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
21 addition
and
12 deletion
+21
-12
examples/librispeech/s0/conf/deepspeech2.yaml
examples/librispeech/s0/conf/deepspeech2.yaml
+5
-5
examples/librispeech/s0/local/data.sh
examples/librispeech/s0/local/data.sh
+6
-6
examples/ngram_lm/README.md
examples/ngram_lm/README.md
+7
-0
examples/spm/README.md
examples/spm/README.md
+3
-1
未找到文件。
examples/librispeech/s0/conf/deepspeech2.yaml
浏览文件 @
c5d85a93
...
...
@@ -10,9 +10,9 @@ data:
min_input_len
:
0.0
max_input_len
:
27.0
# second
min_output_len
:
0.0
max_output_len
:
400.0
min_output_input_ratio
:
0.0
5
max_output_input_ratio
:
10.0
max_output_len
:
.inf
min_output_input_ratio
:
0.0
0
max_output_input_ratio
:
.inf
specgram_type
:
linear
target_sample_rate
:
16000
max_freq
:
None
...
...
@@ -21,7 +21,7 @@ data:
window_ms
:
20.0
delta_delta
:
False
dither
:
1.0
use_dB_normalization
:
True
use_dB_normalization
:
True
target_dB
:
-20
random_seed
:
0
keep_transcription_text
:
False
...
...
@@ -41,7 +41,7 @@ training:
lr
:
1e-3
lr_decay
:
0.83
weight_decay
:
1e-06
global_grad_clip
:
5
.0
global_grad_clip
:
3
.0
log_interval
:
100
decoding
:
...
...
examples/librispeech/s0/local/data.sh
浏览文件 @
c5d85a93
...
...
@@ -17,12 +17,12 @@ if [ ${stage} -le -1 ] && [ ${stop_stage} -ge -1 ]; then
--manifest_prefix
=
"data/manifest"
\
--target_dir
=
"
${
TARGET_DIR
}
/librispeech"
\
--full_download
=
"True"
if
[
$?
-ne
0
]
;
then
echo
"Prepare LibriSpeech failed. Terminated."
exit
1
fi
for
set
in
train-clean-100 train-clean-360 train-other-500 dev-clean dev-other test-clean test-other
;
do
mv
data/manifest.
${
set
}
data/manifest.
${
set
}
.raw
done
...
...
@@ -48,7 +48,7 @@ if [ ${stage} -le 0 ] && [ ${stop_stage} -ge 0 ]; then
--count_threshold
=
0
\
--vocab_path
=
"data/vocab.txt"
\
--manifest_paths
=
"data/manifest.train.raw"
if
[
$?
-ne
0
]
;
then
echo
"Build vocabulary failed. Terminated."
exit
1
...
...
@@ -61,16 +61,16 @@ if [ ${stage} -le 1 ] && [ ${stop_stage} -ge 1 ]; then
num_workers
=
$(
nproc
)
python3
${
MAIN_ROOT
}
/utils/compute_mean_std.py
\
--manifest_path
=
"data/manifest.train.raw"
\
--num_samples
=
-1
\
--num_samples
=
2000
\
--specgram_type
=
"linear"
\
--delta_delta
=
false
\
--sample_rate
=
16000
\
--stride_ms
=
10.0
\
--window_ms
=
20.0
\
--use_dB_normalization
=
Fals
e
\
--use_dB_normalization
=
Tru
e
\
--num_workers
=
${
num_workers
}
\
--output_path
=
"data/mean_std.json"
if
[
$?
-ne
0
]
;
then
echo
"Compute mean and stddev failed. Terminated."
exit
1
...
...
examples/ngram_lm/README.md
0 → 100644
浏览文件 @
c5d85a93
# Ngram LM
Train chinese chararctor ngram lm by
[
kenlm
](
https://github.com/kpu/kenlm
)
.
```
bash run.sh
```
examples/spm/README.md
浏览文件 @
c5d85a93
# SPM demo
# [SentencePiece Model](https://github.com/google/sentencepiece)
Train a
`spm`
model for English tokenizer.
```
bash run.sh
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录