docs: add en docs (#1149)

b964a8e3 · gongenlei · GitHub · 989a89f4 · b964a8e3 · b964a8e3
显示空白变更内容
内联并排

Showing with 79 addition and 0 deletion

demos/speech_translation/README.md demos/speech_translation/README.md +1 -0

demos/speech_translation/README_cn.md demos/speech_translation/README_cn.md +78 -0

未找到文件。
--- a/demos/speech_translation/README.md
+++ b/demos/speech_translation/README.md
+([简体中文](./README_cn.md)|English)
 # Speech Translation
 ## Introduction

--- a/demos/speech_translation/README_cn.md
+++ b/demos/speech_translation/README_cn.md
+(简体中文|[English](./README.md))
+# 语音翻译
+## 介绍
+语音翻译是将会话口语短语翻译成另一语言的过程。
+该 Demo 是从特定音频文件中识别文本并将其翻译为目标语言的实现。它可以通过使用 `PaddleSpeech` 的单个命令或 python 中的几行代码来实现。
+## 使用方法
+### 1. 安装
+```bash
+pip install paddlespeech
+```
+### 2. 准备输入
+这个 Demo 的输入是 WAV(`.wav`) 语音文件
+这里给出一些样例文件供 Demo 使用：
+```bash
+wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
+```
+### 3. 使用方法 (暂不支持Windows)
+- 命令行(推荐使用)
+  ```bash
+  paddlespeech st --input ./en.wav
+  ```
+  使用方法:
+  ```bash
+  paddlespeech st --help
+  ```
+  参数:
+  - `input`(required): 用于翻译的音频.
+  - `model`: 语音翻译的模型类型. 默认: `fat_st_ted`.
+  - `src_lang`: 源语言. 默认: `en`.
+  - `tgt_lang`: 目标语言. 默认: `zh`.
+  - `sample_rate`: 输入音频的采样率. 默认: `16000`.
+  - `config`: 语音翻译任务的配置文件. 如果没有默认使用预训练模型的配置文件. 默认: `None`.
+  - `ckpt_path`: 模型文件. 如果没有默认使用预训练模型. 默认: `None`.
+  - `device`: 选择执行的设备. 默认: 当前环境 paddlepaddle 的默认设备.
+  输出:
+  ```bash
+  [2021-12-09 11:13:03,178] [    INFO] [utils.py] [L225] - ST Result: ['我 在 这栋 建筑 的 古老 门上 敲门 。']
+  ```
+- Python API
+  ```python
+  import paddle
+  from paddlespeech.cli import STExecutor
+  st_executor = STExecutor()
+  text = st_executor(
+      model='fat_st_ted',
+      src_lang='en',
+      tgt_lang='zh',
+      sample_rate=16000,
+      config=None,  # Set `config` and `ckpt_path` to None to use pretrained model.
+      ckpt_path=None,
+      audio_file='./en.wav',
+      device=paddle.get_device())
+  print('ST Result: \n{}'.format(text))
+  ```
+  输出:
+  ```bash
+  ST Result:
+  ['我 在 这栋 建筑 的 古老 门上 敲门 。'] 
+  ```
+### 4. 预训练模型
+以下是 PaddleSpeech 提供的可以被命令行和 python api 使用的预训练模型列表：
+| 模型 | 源语言 | 目标语言
+| :--- | :---: | :---: |
+| fat_st_ted| en| zh