Created by: TyrionZK
阅读源码后发现,注意力实现只有scaled_dot_product_attention函数,paddlepaddle官方能不能开发更多的注意力模块,包括: 1)加上mask的scaled_dot_product_attention 2)完整的多头注意力 3)自注意力实现