Add CI rule to check unittests inplace_atol.
基于内存或是显存优化的需要,部分op支持inplace操作,对于这一类op,在调用check_output的时候会自动比较前向和反向中,是否开启inplace的精度diff。目前默认的diff比较方式要求开启inplace前后的计算结果必须严格相等。
一般情况下,不建议开发者在写单测的时候,设置inplace_atol。除特殊情况,比如group_norm实现使用了cudaAtomicAdd。需要特定的approve。
实际的效果如下: