Created by: zhouwei25
Paddle在训练时如果因为异常原因退出脚本,比如设置过大的batch size,使得python程序挂掉退出,但分配的显存仍然存在,没有自动回收,GPU-Util是0%,如下图的GPU 6,显存都没有释放。只能通过kill -9杀掉相应进程,这是否是一个bug,或功能不支持的地方?