【论文复现】环境出现过崩溃,不止一次
Created by: zb-tjw
- 版本、环境信息: 1)PaddlePaddle版本:PaddlePaddle 1.8.0 2)Python:python3.7 3)GPU:v100 4)复现项目:用GAN来生成Mnist数字
- 训练信息 1)单机,单卡 2)显存信息 16GB 3)应用DCGAN来训练,崩溃出现在晚上9点左右,可能那个时间段用GPU的人数较多,每次做多运行完epoch0和epoch1就崩溃,然后停止环境的时候也会卡好久才能停止。应该不是代码原因,晚上听着课从10点开始再次尝试运行,一直运行到凌晨一点半程序一切正常,自己人为结束的程序。具体的崩溃截图如下:图一是崩溃图,图二是停止环境一直等待的图 以前也经常打卡用这个GPU,从来没有遇到过这个情况,请官方关注,如果可以期望收到问题回复