多卡的时候用profile,会报一个nccl的错误
Created by: houj04
版本:1.7.2GPU。
代码见附件(mnist.txt。实际是个py,但是github不让上传py) mnist.txt
多卡+profile运行的时候会报一个nccl的错,见附件。 multi_card_profile.txt
同样的机器,去掉profile相关的代码(一共就一行),多卡运行正常。 multi_card_no_profile.txt
同样的机器,刷export CUDA_VISIBLE_DEVICES=0变成单卡,运行正常。 single_card_profile.txt