Created by: xuzhm
分支编译的模型并行,依赖cuda9.2的 paddle ,在k40卡 Driver Version: 396.26 上跑完全正常,放到 v100 Driver Version: 418.39 上会出现 cudaGetDeviceCount 失败,有时是1号卡出现,有是3号卡出现,但是4张卡环境变量完全一致。单独查看4张卡都正常。