Created by: lazzylee
语音识别任务相关,搭建了一个简单的 DNN 分类任务 demo
运行流程:
- 进入目录 paddle/demo/kaldi_dnn
- 运行脚本 gpu-start-docker.sh,下载预处理数据,配置 paddle docker container
- 运行脚本 gpu-train-in-docker.sh,进行 DNN 训练和测试,单 GPU 大约需要 20 分钟
待解决问题:
- 1000句训练集,同样的1000句测试时,dataprovider_ark.py 中 provider 参数 cache=CacheType.CACHE_PASS_IN_MEM 时,训练集和测试集错误率约为 4%,当 cache=CacheType.NO_CACHE 时,训练集错误率为 9.6%,测试集错误率为 47.0%,而且最后一次迭代跑完时,会卡住。
- 9000句训练集和 1000句测试集的分类错误率差距很大,训练集错误率为 55.2%,测试集错误率为 85.7%
- 多 GPU 速度没有变快,trainer_count 设置为 2,4,8 时,速度与单 GPU 相比,2(变快 10%),4(相当),8(变慢 75%)