提交 9ec2bc8e 编写于 作者: K KP

Update README. test=doc_fix

上级 f6ba44f1
# Speech Application based on PaddleSpeech # Speech Application based on PaddleSpeech
([简体中文](./README_cn.md)|English)
The directory containes many speech applications in multi scenarios. The directory containes many speech applications in multi scenarios.
* audio tagging - tag audio label in vedio * audio tagging - multi-label tagging of an audio file
* metaverse - 2D AR with TTS * automatic_video_subtitiles - generate subtitles from a video
* speech recogintion - vidio understanding * metaverse - 2D AR with TTS
* punctuation_restoration - restore punctuation from raw text
* speech recogintion - recognize text of an audio file
* speech translation - end to end speech translation * speech translation - end to end speech translation
* story talker - book reader based on OCR and TTS * story talker - book reader based on OCR and TTS
* style_fs2 - multi style control for FastSpeech2 model * style_fs2 - multi style control for FastSpeech2 model
* text_to_speech - convert text into speech
# PaddleSpeech 语音应用 Demo
(简体中文|[English](./README.md))
该目录包含基于 PaddleSpeech 开发的不同场景的语音应用 Demo:
* 声音分类 - 基于 AudioSet 的 527 类标签的音频多标签分类。
* 视频字幕生成 - 识别视频中语音的文本,并进行文本后处理。
* 元宇宙 - 基于语音合成的 2D 增强现实。
* 标点恢复 - 通常作为语音识别的文本后处理任务,为一段无标点的纯文本添加相应的标点符号。
* 语音识别 - 识别一段音频中包含的语音文字。
* 语音翻译 - 实时识别音频中的语言,并同时翻译成目标语言。
* 会说话的故事书 - 基于 OCR 和语音合成的会说话的故事书。
* 个性化语音合成 - 基于 FastSpeech2 模型的个性化语音合成。
* 语音合成 - 基于给定的文本生成语音音频。
# PaddleSpeech Command Line # PaddleSpeech Command Line
([简体中文](./README_cn.md)|English)
The simplest approach to use PaddleSpeech models. The simplest approach to use PaddleSpeech models.
## Help ## Help
...@@ -28,3 +30,9 @@ ...@@ -28,3 +30,9 @@
paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav
``` ```
## Text Post-precessing
- Punctuation Restoration
```bash
paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭
```
# PaddleSpeech 命令行工具
(简体中文|[English](./README.md))
`paddlespeech.cli` 模块是 PaddleSpeech 的命令行工具,它提供了最简便的方式调用 PaddleSpeech 提供的不同语音应用场景的预训练模型,用一行命令就可以进行模型预测:
## 命令行使用帮助
```bash
paddlespeech help
```
## 声音分类
```bash
paddlespeech cls --input input.wav
```
## 语音识别
```
paddlespeech asr --lang zh --input input_16k.wav
```
## 语音翻译(英-中)
(暂不支持Windows系统)
```bash
paddlespeech st --input input_16k.wav
```
## 语音合成
```bash
paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav
```
## 文本后处理
- 标点恢复
```bash
paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭
```
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册