Fork自 PaddlePaddle / Paddle
目前的fused_attention_op不支持attn_mask=None的输入,本PR对此进行了补充,并补充了相应的单测逻辑。
拖放文件到此处或点击上传