Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • DeepSpeech
  • Issue
  • #275

D
DeepSpeech
  • 项目概览

PaddlePaddle / DeepSpeech
大约 2 年 前同步成功

通知 210
Star 8425
Fork 1598
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 245
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 3
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
D
DeepSpeech
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 245
    • Issue 245
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 3
    • 合并请求 3
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 8月 29, 2018 by saxon_zh@saxon_zhGuest

训练自己的模型识别问题

Created by: gangyahaidao

大家好,最近自己训练了一个模型,训练数据相关说明: 1.GPU型号:GeForce GTX 1070

2.训练文件6500个,每个文件都是1到3秒钟,wav格式8000hz

3.基于音频文件对应的文本使用kenlm自己生成了一个语言模型

4.然后进行训练,训练参数如下: CUDA_VISIBLE_DEVICES=0 \ python -u train.py \ --batch_size=32 \ --trainer_count=1 \ --num_passes=50 \ --num_proc_data=16 \ --num_conv_layers=2 \ --num_rnn_layers=3 \ --rnn_layer_size=1024 \ --num_iter_print=100 \ --learning_rate=5e-4 \ --max_duration=27.0 \ --min_duration=0.0 \ --test_off=False \ --use_sortagrad=True \ --use_gru=False \ --use_gpu=True \ --is_local=True \ --share_rnn_weights=False \ --train_manifest='data/mywavs/manifest' \ --dev_manifest='data/mywavs/manifest' \ --mean_std_path='data/mywavs/mean_std.npz' \ --vocab_path='data/mywavs/vocab.txt' \ --output_model_dir='./checkpoints/mywavs' \ --augment_conf_path='conf/augmentation.config' \ --specgram_type='linear' \ --shuffle_method='batch_shuffle_clipped' 其中--num_passes只有50,50次之后得到的结果cerr差不多是十几

5.然后我将训练的模型进行实时识别,但是不管我输入的语音是什么识别的结果一直都是同一句话,或者是没有结果,想问一下这种情况是什么原因引起的呢? 是需要增加数据量? 还是需要增加训练次数?还是调参数呢?

顺便介绍一下我的应用场景,我不是追求那种大而全的语音识别,我进行训练的数据只有两种,一种是用户各种肯定意向的回答,另一种是各种否定的回答,所以文件相对都比较短,前期是先用6500条进行基本的尝试看看效果

指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/DeepSpeech#275
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7