fix(mge/quantization): remove assert in fake_quant_bias to support more QAT mode

GitOrigin-RevId: 8c7f268480e703c896fbb93ca19516aa970a4901

fix(mge/quantization): remove assert in fake_quant_bias to support more QAT mode
GitOrigin-RevId: 8c7f268480e703c896fbb93ca19516aa970a4901
b245e4ed · Megvii Engine Team · 5aecef5d · b245e4ed
显示空白变更内容
内联并排

Showing with 22 addition and 16 deletion

imperative/python/megengine/quantization/utils.py imperative/python/megengine/quantization/utils.py +22 -16

未找到文件。
--- a/imperative/python/megengine/quantization/utils.py
+++ b/imperative/python/megengine/quantization/utils.py
@@ -206,13 +206,19 @@ def fake_quant_bias(bias: Tensor, inp: Tensor, w_qat: Tensor) -> Tensor:
    ):
        inp_params = inp.qparams
        w_params = w_qat.qparams
-        if inp_params.scale is not None and w_params.scale is not None:
-            assert inp_params.mode == w_params.mode, "incompatible QuantMode"
+
+        if inp_params.scale is None or w_params.scale is None:
+            return b_qat
+
+        # TODO: support different mode
+        if inp_params.mode != w_params.mode:
+            return b_qat
+
        # TODO: support quint8 dtype.
-            assert (
-                inp_params.dtype_meta.np_dtype_str == "int8"
-                and w_params.dtype_meta.np_dtype_str == "int8"
-            ), "fake_quant_bias only support int8 like dtype now"
+        if inp_params.dtype_meta.np_dtype_str != "int8":
+            return b_qat
+        if w_params.dtype_meta.np_dtype_str != "int8":
+            return b_qat

        # use the same mode with weight.
        # TODO: avoid hardcode