[cherry-pick-2.2.1]fix fused_transformer_encoder_layer bug (#37229)
修复了fused_transformer_encoder_layer fine-tune过程发现的一些问题:
    fused_attention_op添加attn_mask=None的支持:PR
    pre_layer_norm处理问题:PR
    参数处理,计算错误的问题:PR
    add_bias计算错误问题:PR
    添加pure fp16的支持:PR
Showing
想要评论请 注册 或 登录
