mpi fleet分布式训练 报错:PaddleCheckError: internal error in RPCClient
Created by: maosengshulei
- 版本、环境信息: 1)PaddlePaddle版本:paddle 1.6.0 2)CPU: 4)系统环境:mpi集群
- 训练信息
1)多机
训练中报错
<stdout>:Error Message Summary:
<stdout>:PaddleCheckError: internal error in RPCClient at [/paddle/paddle/fluid/operators/distributed/parameter_prefetch.cc:129]
<stdout>: [operator < distributed_lookup_table > error]