Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
283bbab1
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
283bbab1
编写于
5月 14, 2022
作者:
H
Hui Zhang
提交者:
GitHub
5月 14, 2022
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #1903 from SmileGoat/add_demos
[speechx] fix format of custom demos
上级
15271445
92b20aa3
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
30 addition
and
29 deletion
+30
-29
demos/custom_streaming_asr/README.md
demos/custom_streaming_asr/README.md
+12
-11
demos/custom_streaming_asr/README_cn.md
demos/custom_streaming_asr/README_cn.md
+18
-18
未找到文件。
demos/custom_streaming_asr/README.md
浏览文件 @
283bbab1
...
...
@@ -7,39 +7,40 @@ In some cases, we need to recognize the specific rare words with high accuracy.
this demo is customized for expense account, which need to recognize rare address.
*
G with slot: 打车到 "address_slot"。
*
G with slot: 打车到 "address_slot"。

*
this is address slot wfst, you can add the address which want to recognize.
*
this is address slot wfst, you can add the address which want to recognize.

*
after replace operation, G = fstreplace(G_with_slot, address_slot), we will get the customized graph.
*
after replace operation, G = fstreplace(G_with_slot, address_slot), we will get the customized graph.

## Usage
### 1. Installation
install paddle:2.2.2 docker.
```
sudo
nvidia-
docker pull registry.baidubce.com/paddlepaddle/paddle:2.2.2
sudo docker pull registry.baidubce.com/paddlepaddle/paddle:2.2.2
sudo
nvidia-
docker run --privileged --net=host --ipc=host -it --rm -v $PWD:/paddle --name=paddle_demo_docker registry.baidubce.com/paddlepaddle/paddle:2.2.2 /bin/bash
sudo docker run --privileged --net=host --ipc=host -it --rm -v $PWD:/paddle --name=paddle_demo_docker registry.baidubce.com/paddlepaddle/paddle:2.2.2 /bin/bash
```
### 2. demo
*
run websocket_server.sh. This script will download resources and libs, and launch the service.
```
cd /paddle
bash websocket_server.sh
```
this script run in two steps:
1.
download the resources.tar.gz, those direcotries will be found in resource directory.
model: acustic model
this script run in two steps:
1.
download the resources.tar.gz, those direcotries will be found in resource directory.
model: acustic model
graph: the decoder graph (TLG.fst)
lib: some libs
bin: binary
data: audio and wav.scp
data: audio and wav.scp
2.
websocket_server_main launch the service.
some params:
2.
websocket_server_main launch the service.
some params:
port: the service port
graph_path: the decoder graph path
model_path: acustic model path
...
...
demos/custom_streaming_asr/README_cn.md
浏览文件 @
283bbab1
...
...
@@ -6,45 +6,45 @@
这个 demo 是打车报销单的场景识别,需要识别一些稀有的地名,可以通过如下操作实现。
*
G with slot: 打车到 "address_slot"。
*
G with slot: 打车到 "address_slot"。

*
这是address slot wfst, 可以添加一些需要识别的地名.
*
这是address slot wfst, 可以添加一些需要识别的地名.

*
通过replace 操作, G = fstreplace(G_with_slot, address_slot), 最终可以得到定制化的解码图。
*
通过replace 操作, G = fstreplace(G_with_slot, address_slot), 最终可以得到定制化的解码图。

## 使用方法
### 1. 配置环境
安装paddle:2.2.2 docker镜像。
```
sudo
nvidia-
docker pull registry.baidubce.com/paddlepaddle/paddle:2.2.2
sudo docker pull registry.baidubce.com/paddlepaddle/paddle:2.2.2
sudo
nvidia-
docker run --privileged --net=host --ipc=host -it --rm -v $PWD:/paddle --name=paddle_demo_docker registry.baidubce.com/paddlepaddle/paddle:2.2.2 /bin/bash
sudo docker run --privileged --net=host --ipc=host -it --rm -v $PWD:/paddle --name=paddle_demo_docker registry.baidubce.com/paddlepaddle/paddle:2.2.2 /bin/bash
```
### 2. 演示
*
运行如下命令,完成相关资源和库的下载和服务启动。
```
cd /paddle
bash websocket_server.sh
```
上面脚本完成了如下两个功能:
1.
完成resource.tar.gz下载,解压后,会在resource中发现如下目录:
model: 声学模型
graph: 解码构图
lib: 相关库
bin: 运行程序
data: 语音数据
1.
完成resource.tar.gz下载,解压后,会在resource中发现如下目录:
model: 声学模型
graph: 解码构图
lib: 相关库
bin: 运行程序
data: 语音数据
2.
通过websocket_server_main来启动服务。
这里简单的介绍几个参数:
port是服务端口,
graph_path用来指定解码图文件,
model相关参数用来指定声学模型文件。
其他参数说明可参见代码:
PaddleSpeech/speechx/speechx/decoder/param.h
PaddleSpeech/speechx/examples/ds2_ol/websocket/websocket_server_main.cc
这里简单的介绍几个参数:
port是服务端口,
graph_path用来指定解码图文件,
其他参数说明可参见代码:
PaddleSpeech/speechx/speechx/decoder/param.h
PaddleSpeech/speechx/examples/ds2_ol/websocket/websocket_server_main.cc
*
在另一个终端中, 通过client发送数据,得到结果。运行如下命令:
```
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录