[dev] PaddleLite支持无校准数据的训练后量化方法
Created by: Superjomn
无校准数据的训练后量化方法:
- 训练端:针对conv2d、depthwise_conv2d和mul op的权重,计算fp32权重的绝对值最大值,将fp32权重量化为int8/16类型,保存int8/16权重和scale,产出量化模型。
- 预测端:读取量化模型,使用scale将int8/16类型权重反量化为fp32类型权重,进行正常预测。
- 不降低精度,减小模型存储大小(2~4倍)
具体参考 #2791