Created by: 123malin
参数服务器transpiler模式下支持debug功能:dump模型参数和梯度到指定文件。
transpiler模式后端主体为multi_trainer + hogwilde_worker,前端配置为distributedStrategy,为支持dump功能,涉及到的主要变动有:
- 在hogwild_worker中增加dump_param,dump_field等功能。
- 在multi_trainer中增加dump环境初始化,专门的dump线程用以输出参数/梯度到指定文件。
- 在distributedStrategy中增加set_debug_opt接口,用以配置需要dump的参数信息、输出文件路径等。