Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
3ae01395
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
3ae01395
编写于
5月 16, 2022
作者:
J
Jackwaterveg
提交者:
GitHub
5月 16, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Updata PPASR_cn.md, test=doc
上级
3d81e95c
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
26 addition
and
10 deletion
+26
-10
docs/source/asr/PPASR_cn.md
docs/source/asr/PPASR_cn.md
+26
-10
未找到文件。
docs/source/asr/PPASR_cn.md
浏览文件 @
3ae01395
(简体中文|
[
English
](
./PPASR.md
)
)
# PP-ASR
## 目录
## 目录
-
[
1. 简介
](
#1
)
-
[
1. 简介
](
#1
)
-
[
2. 特点
](
#2
)
-
[
2. 特点
](
#2
)
...
@@ -12,7 +15,7 @@
...
@@ -12,7 +15,7 @@
<a
name=
"1"
></a>
<a
name=
"1"
></a>
## 1. 简介
## 1. 简介
PP-ASR 是一个 提供 ASR 功能的工具。其提供了多种中文和英文的模型,支持模型的训练,并且支持使用命令行的方式进行模型的推理。 PP-ASR也支持流式模型的部署,以及个性化场景的部署。
PP-ASR 是一个 提供 ASR 功能的工具。其提供了多种中文和英文的模型,支持模型的训练,并且支持使用命令行的方式进行模型的推理。 PP-ASR
也支持流式模型的部署,以及个性化场景的部署。
<a
name=
"2"
></a>
<a
name=
"2"
></a>
## 2. 特点
## 2. 特点
...
@@ -32,21 +35,23 @@ PP-ASR 的主要特点如下:
...
@@ -32,21 +35,23 @@ PP-ASR 的主要特点如下:
<a
name=
"31"
></a>
<a
name=
"31"
></a>
## 3.1 预训练模型
## 3.1 预训练模型
支持的预训练模型列表:
[
released_model
.md
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/released_model.md
)
。
支持的预训练模型列表:
[
released_model
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/released_model.md
)
。
其中效果较好的模型为 Ds2 Online Wenetspeech ASR0 Model 以及 Conformer Online Wenetspeech ASR1 Model。 两个模型都支持流式 ASR。
其中效果较好的模型为 Ds2 Online Wenetspeech ASR0 Model 以及 Conformer Online Wenetspeech ASR1 Model。 两个模型都支持流式 ASR。
关于模型设计的部分,可以参考 AIStudio 教程:
-
[
Deepspeech2
](
https://aistudio.baidu.com/aistudio/projectdetail/3866807
)
-
[
Transformer
](
https://aistudio.baidu.com/aistudio/projectdetail/3470110
)
<a
name=
"32"
></a>
<a
name=
"32"
></a>
## 3.2 模型训练
## 3.2 模型训练
模型的训练的参考脚本存放在 examples 中,并按照
`examples/数据集/模型`
存放,数据集主要支持 aishell 和 librispeech,模型支持 deepspeech2 模型和 u2 (conformer/transformer) 模型。
模型的训练的参考脚本存放在 examples 中,并按照
`examples/数据集/模型`
存放,数据集主要支持 aishell 和 librispeech,模型支持 deepspeech2 模型和 u2 (conformer/transformer) 模型。
具体的执行脚本的步骤记录在 run.sh 当中。具体可参考
[
这里
](
https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/aishell/asr1
)
具体的执行脚本的步骤记录在 run.sh 当中。具体可参考
:
[
asr1
](
https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/aishell/asr1
)
<a
name=
"33"
></a>
<a
name=
"33"
></a>
## 3.3 模型推理
## 3.3 模型推理
PPASR 支持在使用
`pip install paddlespeech`
后 使用命令行的方式来使用预训练模型进行推理。
PP
-
ASR 支持在使用
`pip install paddlespeech`
后 使用命令行的方式来使用预训练模型进行推理。
具体支持的功能包括:
具体支持的功能包括:
...
@@ -54,26 +59,37 @@ PPASR 支持在使用`pip install paddlespeech`后 使用命令行的方式来
...
@@ -54,26 +59,37 @@ PPASR 支持在使用`pip install paddlespeech`后 使用命令行的方式来
-
使用管道的方式对多条音频进行预测
-
使用管道的方式对多条音频进行预测
-
支持 RTF 的计算
-
支持 RTF 的计算
具体的使用方式可以参考
[
这里
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/demos/speech_recognition/README_cn.md
)
具体的使用方式可以参考
:
[
speech_recognition
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/demos/speech_recognition/README_cn.md
)
<a
name=
"34"
></a>
<a
name=
"34"
></a>
## 3.4 服务部署
## 3.4 服务部署
PPASR 支持流式ASR的服务部署。支持 语音识别 + 标点处理两个功能同时使用。
PP
-
ASR 支持流式ASR的服务部署。支持 语音识别 + 标点处理两个功能同时使用。
server 的 demo
[
链接
](
https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/demos/streaming_asr_server
)
server 的 demo
:
[
streaming_asr_server
](
https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/demos/streaming_asr_server
)


网页上使用 asr server 的效果展示:
[
streaming_asr_demo_video
](
https://paddlespeech.readthedocs.io/en/latest/streaming_asr_demo_video.html
)
关于服务部署方面的更多资料,可以参考 AIStudio 教程:
-
[
流式服务-模型部分
](
https://aistudio.baidu.com/aistudio/projectdetail/3839884
)
-
[
流式服务
](
https://aistudio.baidu.com/aistudio/projectdetail/4017905
)
<a
name=
"35"
></a>
<a
name=
"35"
></a>
## 3.5 支持个性化场景部署
## 3.5 支持个性化场景部署
针对个性化场景部署,提供了 特征提取(fbank) => 推理模型(打分库)=> TLG(WFST, token, lexion, grammer)的 C++ 程序。具体参考
[
这里
](
https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/speechx
)
针对个性化场景部署,提供了特征提取(fbank) => 推理模型(打分库)=> TLG(WFST, token, lexion, grammer)的 C++ 程序。具体参考
[
speechx
](
https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/speechx
)
。 如果想快速了解和使用,可以参考:
[
custom_streaming_asr
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/demos/custom_streaming_asr/README_cn.md
)
关于支持个性化场景部署的更多资料,可以参考 AIStudio 教程:
-
[
定制化识别
](
https://aistudio.baidu.com/aistudio/projectdetail/4021561
)
<a
name=
"4"
></a>
<a
name=
"4"
></a>
## 4. 快速开始
## 4. 快速开始
关于如果使用 PP
ASR,可以看这里的
[
安装文档
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/install_cn.md
)
,其中提供了
**简单**
、
**中等**
、
**困难**
三种安装方式。如果想体验
paddlespeech 的推理功能,可以用
**简单**
安装方式。
关于如果使用 PP
-ASR,可以看这里的
[
install
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/install_cn.md
)
,其中提供了
**简单**
、
**中等**
、
**困难**
三种安装方式。如果想体验
paddlespeech 的推理功能,可以用
**简单**
安装方式。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录