MPI分布式训练过程有core,没有core信息 ,同时线下发现不了
Created by: wawltor
在训练过程中训练任务还没有开始,就有core,线下开启多端口的ps模式复现不了
日志信息: .//paddle/start_trainer.sh: line 112: 21797 Segmentation fault (core dumped) FLAGS_rpc_deadline=3000000 CPU_NUM=2 python cluster_train.py --is_sparse --is_distributed --sample_workers 2
错误码:139