Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
afe49c5f
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
1 年多 前同步成功
通知
207
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
afe49c5f
编写于
2月 02, 2021
作者:
H
Hui Zhang
提交者:
GitHub
2月 02, 2021
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #517 from PaddlePaddle/1.8
update data source and remove useless code
上级
3f99a4dd
71f37a8a
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
6 addition
and
2 deletion
+6
-2
data/aishell/aishell.py
data/aishell/aishell.py
+1
-0
data/librispeech/librispeech.py
data/librispeech/librispeech.py
+1
-0
data/voxforge/voxforge.py
data/voxforge/voxforge.py
+1
-0
data_utils/data.py
data_utils/data.py
+2
-2
data_utils/speech.py
data_utils/speech.py
+1
-0
未找到文件。
data/aishell/aishell.py
浏览文件 @
afe49c5f
...
...
@@ -19,6 +19,7 @@ from data_utils.utility import download, unpack
DATA_HOME
=
os
.
path
.
expanduser
(
'~/.cache/paddle/dataset/speech'
)
URL_ROOT
=
'http://www.openslr.org/resources/33'
URL_ROOT
=
'https://openslr.magicdatatech.com/resources/33'
DATA_URL
=
URL_ROOT
+
'/data_aishell.tgz'
MD5_DATA
=
'2f494334227864a8a8fec932999db9d8'
...
...
data/librispeech/librispeech.py
浏览文件 @
afe49c5f
...
...
@@ -20,6 +20,7 @@ import io
from
data_utils.utility
import
download
,
unpack
URL_ROOT
=
"http://www.openslr.org/resources/12"
URL_ROOT
=
"https://openslr.magicdatatech.com/resources/12"
URL_TEST_CLEAN
=
URL_ROOT
+
"/test-clean.tar.gz"
URL_TEST_OTHER
=
URL_ROOT
+
"/test-other.tar.gz"
URL_DEV_CLEAN
=
URL_ROOT
+
"/dev-clean.tar.gz"
...
...
data/voxforge/voxforge.py
浏览文件 @
afe49c5f
...
...
@@ -11,6 +11,7 @@ from __future__ import print_function
import
os
import
codecs
import
datetime
import
soundfile
import
json
import
argparse
...
...
data_utils/data.py
浏览文件 @
afe49c5f
...
...
@@ -276,8 +276,8 @@ class DataGenerator(object):
def
reader
():
for
instance
in
manifest
:
inst
=
self
.
process_utterance
(
instance
[
"audio_filepath"
],
instance
[
"text"
])
,
yield
inst
[
0
]
instance
[
"text"
])
yield
inst
return
reader
...
...
data_utils/speech.py
浏览文件 @
afe49c5f
...
...
@@ -3,6 +3,7 @@ from __future__ import absolute_import
from
__future__
import
division
from
__future__
import
print_function
import
numpy
as
np
from
data_utils.audio
import
AudioSegment
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录