INT8 inference accuracy lost after enabling quantization of elementwise_add in a new Ernie Quant model (#25532) · Issue · PaddlePaddle / Paddle

INT8 inference accuracy lost after enabling quantization of elementwise_add in a new Ernie Quant model

Created by: wojtuss

Recently @lidanqing-intel has generated a new Quant Ernie model. It contains quantization scales for elementwise_add operators to be quantized. However, after enabling quantization of elementwise_add ops, the accuracy is lost.

We are investigating the issue.

PaddlePaddle / Paddle 大约 2 年 前同步成功

INT8 inference accuracy lost after enabling quantization of elementwise_add in a new Ernie Quant model

PaddlePaddle / Paddle
大约 2 年前同步成功