models里面的bert训练时异常退出(很大可能是显存不足),报0xC0000409
Created by: wang001
尝试过bert-wwm(哈工大提供的),在keras上面可以跑batch_size=6,max_seq=512。 但是,在这里面只能跑batch=1,seq_len=300(我试过) 版本、环境信息: 1)PaddlePaddle版本:1.5.0.post87 2)CPU:i5 9400f 3)GPU:1080ti,通过anaconda安装的cudatoolkit 8.0,cudnn7.1.4 4)系统环境:win10专业版,64位,Python版本 3.6.8
- 模型信息 1)模型名称:bert 2)datafountain-ccf-情感分析比赛 3)使用算法名称 4)模型链接:https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/language_representations_kit/BERT
- 复现信息:将哈工大提供的bert-wwm通过上面代码库中convert_params.py转为paddle模型,然后设置max_seq=512,batch=1,运行即可。
- 问题描述:在max_seq=300,batch_size=1时发现可以正常运行,但是我在keras上面可以设置batch=6,max_seq=512。显存利用存在很大的问题。