Created by: taoja12
模型训练后量化中,对于权重Tensor的量化操作采用非饱和量化方法(No Saturation),对于输入采用饱和量化方法(Saturation),那权重和输入进行矩阵相乘后,反量化成float32的操作原理是什么?比如反量化的计算公式,反量化的尺度怎么选择的(因为权重和输入采用两种量化方式,所以反量化如何计算不太清楚)?