Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
b964a8e3
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 1 年 前同步成功
通知
207
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
未验证
提交
b964a8e3
编写于
12月 16, 2021
作者:
G
gongenlei
提交者:
GitHub
12月 16, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
docs: add en docs (#1149)
上级
989a89f4
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
79 addition
and
0 deletion
+79
-0
demos/speech_translation/README.md
demos/speech_translation/README.md
+1
-0
demos/speech_translation/README_cn.md
demos/speech_translation/README_cn.md
+78
-0
未找到文件。
demos/speech_translation/README.md
浏览文件 @
b964a8e3
(
[
简体中文
](
./README_cn.md
)
|English)
# Speech Translation
## Introduction
...
...
demos/speech_translation/README_cn.md
0 → 100644
浏览文件 @
b964a8e3
(简体中文|
[
English
](
./README.md
)
)
# 语音翻译
## 介绍
语音翻译是将会话口语短语翻译成另一语言的过程。
该 Demo 是从特定音频文件中识别文本并将其翻译为目标语言的实现。它可以通过使用
`PaddleSpeech`
的单个命令或 python 中的几行代码来实现。
## 使用方法
### 1. 安装
```
bash
pip
install
paddlespeech
```
### 2. 准备输入
这个 Demo 的输入是 WAV(
`.wav`
) 语音文件
这里给出一些样例文件供 Demo 使用:
```
bash
wget
-c
https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
```
### 3. 使用方法 (暂不支持Windows)
-
命令行(推荐使用)
```
bash
paddlespeech st
--input
./en.wav
```
使用方法:
```
bash
paddlespeech st
--help
```
参数:
-
`input`
(required): 用于翻译的音频.
-
`model`
: 语音翻译的模型类型. 默认:
`fat_st_ted`
.
-
`src_lang`
: 源语言. 默认:
`en`
.
-
`tgt_lang`
: 目标语言. 默认:
`zh`
.
-
`sample_rate`
: 输入音频的采样率. 默认:
`16000`
.
-
`config`
: 语音翻译任务的配置文件. 如果没有默认使用预训练模型的配置文件. 默认:
`None`
.
-
`ckpt_path`
: 模型文件. 如果没有默认使用预训练模型. 默认:
`None`
.
-
`device`
: 选择执行的设备. 默认: 当前环境 paddlepaddle 的默认设备.
输出:
```
bash
[
2021-12-09 11:13:03,178]
[
INFO]
[
utils.py]
[
L225] - ST Result:
[
'我 在 这栋 建筑 的 古老 门上 敲门 。'
]
```
-
Python API
```
python
import
paddle
from
paddlespeech.cli
import
STExecutor
st_executor
=
STExecutor
()
text
=
st_executor
(
model
=
'fat_st_ted'
,
src_lang
=
'en'
,
tgt_lang
=
'zh'
,
sample_rate
=
16000
,
config
=
None
,
# Set `config` and `ckpt_path` to None to use pretrained model.
ckpt_path
=
None
,
audio_file
=
'./en.wav'
,
device
=
paddle
.
get_device
())
print
(
'ST Result:
\n
{}'
.
format
(
text
))
```
输出:
```
bash
ST Result:
[
'我 在 这栋 建筑 的 古老 门上 敲门 。'
]
```
### 4. 预训练模型
以下是 PaddleSpeech 提供的可以被命令行和 python api 使用的预训练模型列表:
| 模型 | 源语言 | 目标语言
| :--- | :---: | :---: |
| fat_st_ted| en| zh
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录