Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
417a8b79
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
417a8b79
编写于
8月 16, 2021
作者:
H
Hui Zhang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix ted egs
上级
25c07e3f
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
33 addition
and
20 deletion
+33
-20
examples/ted_en_zh/t0/.gitignore
examples/ted_en_zh/t0/.gitignore
+3
-0
examples/ted_en_zh/t0/README.md
examples/ted_en_zh/t0/README.md
+10
-0
examples/ted_en_zh/t0/local/data.sh
examples/ted_en_zh/t0/local/data.sh
+19
-19
examples/ted_en_zh/t0/run.sh
examples/ted_en_zh/t0/run.sh
+1
-1
未找到文件。
examples/ted_en_zh/t0/.gitignore
0 → 100644
浏览文件 @
417a8b79
TED-En-Zh
data
exp
examples/ted_en_zh/t0/README.md
0 → 100644
浏览文件 @
417a8b79
# TED En-Zh
## Dataset
| Data Subset | Duration in Seconds |
| --- | --- |
| data/manifest.train | 0.942 ~ 60 |
| data/manifest.dev | 1.151 ~ 39 |
| data/manifest.test | 1.1 ~ 42.746 |
examples/ted_en_zh/t0/local/data.sh
浏览文件 @
417a8b79
...
...
@@ -7,37 +7,37 @@ stop_stage=100
nbpe
=
8000
bpemode
=
unigram
bpeprefix
=
"data/bpe_
${
bpemode
}
_
${
nbpe
}
"
DATA_DIR
=
data_dir
=
/mnt/dataset/TED_EnZh
source
${
MAIN_ROOT
}
/utils/parse_options.sh
mkdir
-p
data
TARGET_DIR
=
${
MAIN_ROOT
}
/examples/dataset
mkdir
-p
${
TARGET_DIR
}
mkdir
-p
data
if
[
!
-d
${
SOURCE_DIR
}
]
;
then
echo
"Error: Dataset is not avaiable. Please download and unzip the dataset"
echo
"Download Link: https://pan.baidu.com/s/18L-59wgeS96WkObISrytQQ Passwd: bva0"
echo
"The tree of the directory should be:"
echo
"."
echo
"|-- En-Zh"
echo
"|-- test-segment"
echo
" |-- tst2010"
echo
" |-- ..."
echo
"|-- train-split"
echo
" |-- train-segment"
echo
"|-- README.md"
exit
1
fi
if
[
${
stage
}
-le
-1
]
&&
[
${
stop_stage
}
-ge
-1
]
;
then
if
[
!
-e
${
data_dir
}
]
;
then
echo
"Error: Dataset is not avaiable. Please download and unzip the dataset"
echo
"Download Link: https://pan.baidu.com/s/18L-59wgeS96WkObISrytQQ Passwd: bva0"
echo
"The tree of the directory should be:"
echo
"."
echo
"|-- En-Zh"
echo
"|-- test-segment"
echo
" |-- tst2010"
echo
" |-- ..."
echo
"|-- train-split"
echo
" |-- train-segment"
echo
"|-- README.md"
exit
1
fi
# generate manifests
python3
${
TARGET_DIR
}
/ted_en_zh/ted_en_zh.py
\
--manifest_prefix
=
"data/manifest"
\
--src_dir
=
"
${
DATA_DIR
}
"
--src_dir
=
"
${
data_dir
}
"
echo
"Complete raw data pre-process."
fi
...
...
examples/ted_en_zh/t0/run.sh
浏览文件 @
417a8b79
...
...
@@ -16,7 +16,7 @@ echo "checkpoint name ${ckpt}"
if
[
${
stage
}
-le
0
]
&&
[
${
stop_stage
}
-ge
0
]
;
then
# prepare data
bash ./local/data.sh
--
DATA_DIR
${
data_path
}
||
exit
-1
bash ./local/data.sh
--
data_dir
${
data_path
}
||
exit
-1
fi
if
[
${
stage
}
-le
1
]
&&
[
${
stop_stage
}
-ge
1
]
;
then
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录