Created by: phlrain
PR types
Others
PR changes
Others
Describe
修复 test_parallel_executor_fetch_isolated_var 单测容易hang的问题
hang的具体原因是parallel ssa graph executor执行的时候,参数梯度产生的顺序不固定,多个all reduce 在进行同步的时候shape不一致,nccl失败
这个单测主要目的是为了测试fetch 一个feed的var的正确性得问题, 暂时性修复方式是把参数个数变成是一个,防止nccl失败,由于parallel ssa graph executor 目前没有对用户直接暴露,后续会修复parallel ssa graph executor 产生梯度顺序不一致的问题