Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
cfed8d01
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
cfed8d01
编写于
12月 01, 2021
作者:
J
Jackwaterveg
提交者:
GitHub
12月 01, 2021
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #1061 from LittleChenCc/develop
[Bug Fix] fix bugs in the data reader
上级
cd2e8d35
3a14b828
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
3 addition
and
3 deletion
+3
-3
examples/ted_en_zh/st0/local/data.sh
examples/ted_en_zh/st0/local/data.sh
+1
-1
paddlespeech/s2t/frontend/utility.py
paddlespeech/s2t/frontend/utility.py
+2
-2
未找到文件。
examples/ted_en_zh/st0/local/data.sh
浏览文件 @
cfed8d01
...
@@ -42,7 +42,7 @@ if [ ${stage} -le -1 ] && [ ${stop_stage} -ge -1 ]; then
...
@@ -42,7 +42,7 @@ if [ ${stage} -le -1 ] && [ ${stop_stage} -ge -1 ]; then
# generate manifests
# generate manifests
python3
${
TARGET_DIR
}
/ted_en_zh/ted_en_zh.py
\
python3
${
TARGET_DIR
}
/ted_en_zh/ted_en_zh.py
\
--manifest_prefix
=
"data/manifest"
\
--manifest_prefix
=
"data/manifest"
\
--src
_
dir
=
"
${
data_dir
}
"
--src
-
dir
=
"
${
data_dir
}
"
echo
"Complete raw data pre-process."
echo
"Complete raw data pre-process."
fi
fi
...
...
paddlespeech/s2t/frontend/utility.py
浏览文件 @
cfed8d01
...
@@ -102,9 +102,9 @@ def read_manifest(
...
@@ -102,9 +102,9 @@ def read_manifest(
with
jsonlines
.
open
(
manifest_path
,
'r'
)
as
reader
:
with
jsonlines
.
open
(
manifest_path
,
'r'
)
as
reader
:
for
json_data
in
reader
:
for
json_data
in
reader
:
feat_len
=
json_data
[
"input"
][
0
][
"shape"
][
feat_len
=
json_data
[
"input"
][
0
][
"shape"
][
0
]
if
'shape'
in
json_data
[
"input"
][
0
]
else
1.0
0
]
if
"input"
in
json_data
and
"shape"
in
json_data
[
"input"
][
0
]
else
1.0
token_len
=
json_data
[
"output"
][
0
][
"shape"
][
token_len
=
json_data
[
"output"
][
0
][
"shape"
][
0
]
if
'shape'
in
json_data
[
"output"
][
0
]
else
1.0
0
]
if
"output"
in
json_data
and
"shape"
in
json_data
[
"output"
][
0
]
else
1.0
conditions
=
[
conditions
=
[
feat_len
>=
min_input_len
,
feat_len
>=
min_input_len
,
feat_len
<=
max_input_len
,
feat_len
<=
max_input_len
,
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录