未验证 提交 19e0f2ac 编写于 作者: H Hui Zhang 提交者: GitHub

Fix doc format (#546)

上级 57ed5cd2
......@@ -4,17 +4,6 @@
*DeepSpeech on PaddlePaddle* is an open-source implementation of end-to-end Automatic Speech Recognition (ASR) engine, with [PaddlePaddle](https://github.com/PaddlePaddle/Paddle) platform. Our vision is to empower both industrial application and academic research on speech recognition, via an easy-to-use, efficient and scalable implementation, including training, inference & testing module, and demo deployment.
For more information, please see below:
[Install](docs/install.md)
[Getting Started](docs/geting_stared.md)
[Data Prepration](docs/data_preparation.md)
[Data Augmentation](docs/augmentation.md)
[Ngram LM](docs/ngram_lm.md)
[Server Demo](docs/server.md)
[Benchmark](docs/benchmark.md)
[Relased Model](docs/released_model.md)
[FAQ](docs/faq.md)
## Models
* [Baidu's Deep Speech2](http://proceedings.mlr.press/v48/amodei16.pdf)
......@@ -43,6 +32,17 @@ source tools/venv/bin/activate
Please see [Getting Started](docs/geting_started.md) and [tiny egs](examples/tiny/README.md).
## More Information
* [Install](docs/install.md)
* [Getting Started](docs/geting_stared.md)
* [Data Prepration](docs/data_preparation.md)
* [Data Augmentation](docs/augmentation.md)
* [Ngram LM](docs/ngram_lm.md)
* [Server Demo](docs/server.md)
* [Benchmark](docs/benchmark.md)
* [Relased Model](docs/released_model.md)
* [FAQ](docs/faq.md)
## Questions and Help
......
......@@ -5,22 +5,11 @@
*DeepSpeech on PaddlePaddle*是一个采用[PaddlePaddle](https://github.com/PaddlePaddle/Paddle)平台的端到端自动语音识别(ASR)引擎的开源项目,
我们的愿景是为语音识别在工业应用和学术研究上,提供易于使用、高效和可扩展的工具,包括训练,推理,测试模块,以及 demo 部署。同时,我们还将发布一些预训练好的英语和普通话模型。
更多信息如下:
[安装](docs/install.md)
[开始](docs/geting_stared.md)
[数据处理](docs/data_preparation.md)
[数据增强](docs/augmentation.md)
[语言模型](docs/ngram_lm.md)
[服务部署](docs/server.md)
[Benchmark](docs/benchmark.md)
[Relased Model](docs/released_model.md)
[FAQ](docs/faq.md)
## 模型
* [Baidu's Deep Speech2](http://proceedings.mlr.press/v48/amodei16.pdf)
## 安装
* python3.7
* python 3.7
* paddlepaddle 2.0.0
- 安装依赖
......@@ -43,6 +32,18 @@ source tools/venv/bin/activate
请查看 [Getting Started](docs/geting_started.md)[tiny egs](examples/tiny/README.md)
## 更多信息
* [安装](docs/install.md)
* [开始](docs/geting_stared.md)
* [数据处理](docs/data_preparation.md)
* [数据增强](docs/augmentation.md)
* [语言模型](docs/ngram_lm.md)
* [服务部署](docs/server.md)
* [Benchmark](docs/benchmark.md)
* [Relased Model](docs/released_model.md)
* [FAQ](docs/faq.md)
## 问题和帮助
欢迎您在[Github问题](https://github.com/PaddlePaddle/models/issues)中提交问题和bug。也欢迎您为这个项目做出贡献。
......@@ -2,36 +2,36 @@
1. 音频变速快慢到达什么晨读会影响识别率?
变速会提升识别效果,一般用0.9, 1.0, 1.1 的变速。
变速会提升识别效果,一般用0.9, 1.0, 1.1 的变速。
2. 音量大小到什么程度会影响识别率?
一般训练会固定音量到一个范围内,波动过大会影响训练,估计在10dB ~ 20dB吧。
一般训练会固定音量到一个范围内,波动过大会影响训练,估计在10dB ~ 20dB吧。
3. 语音模型训练数据的最小时长要求时多少?
Aishell-1大约178h的数据,数据越多越好。
Aishell-1大约178h的数据,数据越多越好。
4. 那些噪声或背景生会影响识别率?
4. 那些噪声或背景生会影响识别率?
主要是人生干扰和低信噪比会影响识别率。
主要是人生干扰和低信噪比会影响识别率。
5. 单条语音数据的长度限制是多少?
5. 单条语音数据的长度限制是多少?
一般训练的语音长度会限制在1s~6s之间,和训练配置有关。
一般训练的语音长度会限制在1s~6s之间,和训练配置有关。
6. 背景声在识别前是否需要分离出来,或做降噪处理?
6. 背景声在识别前是否需要分离出来,或做降噪处理?
需要分离的,需要结合具体场景考虑。
需要分离的,需要结合具体场景考虑。
7. 模型是否带有VAD人生激活识别能力?
7. 模型是否带有VAD人生激活识别能力?
VAD是单独的模型或模块,模型不包含此能力。
VAD是单独的模型或模块,模型不包含此能力。
8. 是否支持长语音识别?
8. 是否支持长语音识别?
一般过VAD后识别。
一般过VAD后识别。
9. Mandarin LM Large语言模型需要的硬件配置时怎样的?
9. Mandarin LM Large语言模型需要的硬件配置时怎样的?
内存能放得下LM即可。
内存能放得下LM即可。
......@@ -2,8 +2,6 @@
## CTC
| Model | Config | Test set | CER |
| --- | --- | --- | --- |
| --- | --- | --- | --- |
| DeepSpeech2 | conf/deepspeech2.yaml | test | 0.078977 |
| DeepSpeech2 | release 1.8.5 | test | 0.080447 |
......@@ -2,8 +2,6 @@
## CTC
| Model | Config | Test set | CER |
| --- | --- | --- | --- |
| --- | --- | --- | --- |
| DeepSpeech2 | conf/deepspeech2.yaml | test-clean | 0.073973 |
| DeepSpeech2 | release 1.8.5 | test-clean | 0.074939 |
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册