Created by: taoja12
1、动态离线量化可以将模型特定OP权重量化成int8/int16,意思是将模型中的权重量化成int8之后,就保持权重int8的状态然后输出模型吗?(不用像静态离线量化中,在卷积前量化,卷积后反量化这种操作?)
2、那么动态离线量化中的权重量化原理也是非饱和量化吗?具体的量化原理可以说一下吗?
3、调用动态离线量化后的模型预测,那么在input float32数据后,如何将该模型的Int8权重反量化成float32?