You need to sign in or sign up before continuing.
README_cn.md 2.3 KB
Newer Older
G
gongenlei 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
(简体中文|[English](./README.md))
# 语音翻译

## 介绍
语音翻译是将会话口语短语翻译成另一语言的过程。

该 Demo 是从特定音频文件中识别文本并将其翻译为目标语言的实现。它可以通过使用 `PaddleSpeech` 的单个命令或 python 中的几行代码来实现。

## 使用方法
### 1. 安装
```bash
pip install paddlespeech
```
### 2. 准备输入
这个 Demo 的输入是 WAV(`.wav`) 语音文件

这里给出一些样例文件供 Demo 使用:
```bash
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
```

### 3. 使用方法 (暂不支持Windows)
- 命令行(推荐使用)
  ```bash
  paddlespeech st --input ./en.wav
  ```
27
  使用方法:
G
gongenlei 已提交
28 29 30
  ```bash
  paddlespeech st --help
  ```
31 32 33 34 35 36 37 38 39
  参数:
  - `input`(必须输入):用于翻译的音频。
  - `model`: 语音翻译的模型类型. 默认:`fat_st_ted`
  - `src_lang`: 源语言. 默认:`en`
  - `tgt_lang`: 目标语言. 默认:`zh`
  - `sample_rate`:输入音频的采样率. 默认:`16000`
  - `config`:语音翻译任务的配置文件. 如果没有默认使用预训练模型的配置文件. 默认:`None`
  - `ckpt_path`:模型文件. 如果没有默认使用预训练模型. 默认:`None`
  - `device`:选择执行的设备. 默认: 当前环境 paddlepaddle 的默认设备。
G
gongenlei 已提交
40

41
  输出:
G
gongenlei 已提交
42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63
  ```bash
  [2021-12-09 11:13:03,178] [    INFO] [utils.py] [L225] - ST Result: ['我 在 这栋 建筑 的 古老 门上 敲门 。']
  ```

- Python API
  ```python
  import paddle
  from paddlespeech.cli import STExecutor
  
  st_executor = STExecutor()
  text = st_executor(
      model='fat_st_ted',
      src_lang='en',
      tgt_lang='zh',
      sample_rate=16000,
      config=None,  # Set `config` and `ckpt_path` to None to use pretrained model.
      ckpt_path=None,
      audio_file='./en.wav',
      device=paddle.get_device())
  print('ST Result: \n{}'.format(text))
  ```

64
  输出:
G
gongenlei 已提交
65 66 67 68 69 70 71
  ```bash
  ST Result:
  ['我 在 这栋 建筑 的 古老 门上 敲门 。'] 
  ```

### 4. 预训练模型

72
以下是 PaddleSpeech 提供的可以被命令行和 python API 使用的预训练模型列表:
G
gongenlei 已提交
73 74 75 76

| 模型 | 源语言 | 目标语言
| :--- | :---: | :---: |
| fat_st_ted| en| zh