Created by: songyouwei
当前Linear使用的matmulop的底层实现在存在>=3d的输入时,使用的是BatchedGEMM,不如mul使用GEMM高效。 此PR将Linear使用的op换成mul。
Linear
matmul
mul