Created by: sarawon
利用cluster_train下面提供的脚本进行多级训练,是否支持多个cluster job并行?测试发现每次启动一个新的cluster job,会有一个Kill操作,把现有的paddle_process都kill掉