diff --git a/mace/python/tools/converter_tool/base_converter.py b/mace/python/tools/converter_tool/base_converter.py
index bc907aee9e2ea9cc29406ff4053ac33033bca87f..33ef662cf91715aec3fef0ab838d62eb45fa7b1f 100644
--- a/mace/python/tools/converter_tool/base_converter.py
+++ b/mace/python/tools/converter_tool/base_converter.py
@@ -33,6 +33,7 @@ class FilterFormat(Enum):
     HWIO = 0
     OIHW = 1
     HWOI = 2
+    OHWI = 3
 
 
 class PaddingMode(Enum):
@@ -325,50 +326,41 @@ class ConverterOption(object):
             self._transformer_option = [TransformerRule[transformer]
                                         for transformer in self._transformer_option]  # noqa
         else:
-            if not self._quantize:
-                self._transformer_option = [
-                    TransformerRule.REMOVE_IDENTITY_OP,
-                    TransformerRule.TRANSFORM_GLOBAL_POOLING,
-                    TransformerRule.FOLD_RESHAPE,
-                    TransformerRule.TRANSFORM_MATMUL_TO_FC,
-                    TransformerRule.FOLD_BATCHNORM,
-                    TransformerRule.FOLD_CONV_AND_BN,
-                    TransformerRule.FOLD_DEPTHWISE_CONV_AND_BN,
-                    TransformerRule.TRANSFORM_GPU_WINOGRAD,
-                    TransformerRule.TRANSFORM_ADD_TO_BIASADD,
-                    TransformerRule.FOLD_BIASADD,
-                    TransformerRule.FLATTEN_ATROUS_CONV,
-                    TransformerRule.FOLD_ACTIVATION,
-                    TransformerRule.TRANSPOSE_FILTERS,
-                    TransformerRule.TRANSPOSE_DATA_FORMAT,
-                    TransformerRule.ADD_IN_OUT_TENSOR_INFO,
-                    TransformerRule.TRANSFORM_GLOBAL_CONV_TO_FC,
-                    TransformerRule.RESHAPE_FC_WEIGHT,
-                    TransformerRule.TRANSFORM_BUFFER_IMAGE,
-                    TransformerRule.ADD_DEVICE,
-                    TransformerRule.UPDATE_FLOAT_OP_DATA_TYPE,
-                    TransformerRule.ADD_MACE_INPUT_AND_OUTPUT_NODES,
-                    TransformerRule.SORT_BY_EXECUTION,
-                ]
-            else:
-                self._transformer_option = [
-                    TransformerRule.REMOVE_IDENTITY_OP,
-                    TransformerRule.TRANSFORM_GLOBAL_POOLING,
-                    TransformerRule.FOLD_RESHAPE,
-                    TransformerRule.TRANSFORM_MATMUL_TO_FC,
-                    TransformerRule.FOLD_BATCHNORM,
-                    TransformerRule.FOLD_CONV_AND_BN,
-                    TransformerRule.FOLD_DEPTHWISE_CONV_AND_BN,
-                    TransformerRule.TRANSFORM_GPU_WINOGRAD,
-                    TransformerRule.TRANSFORM_ADD_TO_BIASADD,
-                    TransformerRule.FOLD_BIASADD,
-                    TransformerRule.FLATTEN_ATROUS_CONV,
-                    TransformerRule.FOLD_ACTIVATION,
-                    TransformerRule.ADD_IN_OUT_TENSOR_INFO,
+            self._transformer_option = [
+                # Model structure related transformation
+                TransformerRule.REMOVE_IDENTITY_OP,
+                TransformerRule.TRANSFORM_GLOBAL_POOLING,
+                TransformerRule.FOLD_RESHAPE,
+                TransformerRule.TRANSFORM_MATMUL_TO_FC,
+                TransformerRule.FOLD_BATCHNORM,
+                TransformerRule.FOLD_CONV_AND_BN,
+                TransformerRule.FOLD_DEPTHWISE_CONV_AND_BN,
+                TransformerRule.TRANSFORM_GPU_WINOGRAD,
+                TransformerRule.TRANSFORM_ADD_TO_BIASADD,
+                TransformerRule.FOLD_BIASADD,
+                TransformerRule.FLATTEN_ATROUS_CONV,
+                TransformerRule.FOLD_ACTIVATION,
+                TransformerRule.TRANSFORM_GLOBAL_CONV_TO_FC,
+                TransformerRule.RESHAPE_FC_WEIGHT,
+                # Model data format related transformation
+                TransformerRule.TRANSPOSE_FILTERS,
+                TransformerRule.TRANSPOSE_DATA_FORMAT,
+                # Mace model structure related transformation
+                TransformerRule.ADD_IN_OUT_TENSOR_INFO,
+                # Device related transformation
+                TransformerRule.TRANSFORM_BUFFER_IMAGE,
+                TransformerRule.ADD_DEVICE,
+                # Data type related transformation
+                TransformerRule.UPDATE_FLOAT_OP_DATA_TYPE,
+                # Transform finalization
+                TransformerRule.ADD_MACE_INPUT_AND_OUTPUT_NODES,
+                TransformerRule.SORT_BY_EXECUTION,
+            ]
+            if self._quantize:
+                self._transformer_option = self._transformer_option[:-1] + [
                     TransformerRule.QUANTIZE_NODES,
                     TransformerRule.ADD_QUANTIZE_TENSOR_RANGE,
                     TransformerRule.QUANTIZE_WEIGHTS,
-                    TransformerRule.ADD_DEVICE,
                     TransformerRule.SORT_BY_EXECUTION,
                 ]
 
diff --git a/mace/python/tools/converter_tool/transformer.py b/mace/python/tools/converter_tool/transformer.py
index 30e4210ab07406f8aa52a5b4aaa6955c940b2166..1e68cb14a90ea40f3c7b0cb38832efc69b855bcb 100644
--- a/mace/python/tools/converter_tool/transformer.py
+++ b/mace/python/tools/converter_tool/transformer.py
@@ -102,7 +102,8 @@ class Transformer(base_converter.ConverterInterface):
         self._quantize_activation_info = {}
         self._quantized_tensor = set()
 
-        if self._option.device == DeviceType.CPU.value:
+        if self._option.device == DeviceType.CPU.value and \
+                not self._option.quantize:
             self._target_data_format = DataFormat.NCHW
 
     def run(self):
@@ -710,6 +711,66 @@ class Transformer(base_converter.ConverterInterface):
 
         return False
 
+    def transform_global_conv_to_fc(self):
+        """Transform global conv to fc should be placed after transposing
+        input/output and filter"""
+
+        if self._option.quantize:
+            return
+
+        net = self._model
+        for op in net.op:
+            if op.type == MaceOp.Conv2D.name:
+                producer = self._producer[op.input[0]]
+                input_shape = producer.output_shape[0].dims
+                batch, height, width, channels = self.sort_feature_map_shape(
+                    input_shape, ConverterUtil.data_format(producer))
+                filter = self._consts[op.input[1]]
+                filter_shape = filter.dims
+                filter_height, filter_width, in_channels, out_channels = \
+                    self.sort_filter_shape(filter_shape, self.filter_format())
+                zero_padding = True
+                padding_arg = ConverterUtil.get_arg(op,
+                                                    MaceKeyword.mace_padding_str)  # noqa
+                if padding_arg is not None:
+                    if padding_arg.i != PaddingMode.VALID.value:
+                        zero_padding = False
+                else:
+                    padding_value_arg = ConverterUtil.get_arg(op,
+                                                              MaceKeyword.mace_padding_values_str)  # noqa
+                    if padding_value_arg is not None:
+                        if not all(v == 0 for v in padding_value_arg.ints):
+                            zero_padding = False
+
+                if height == filter_height and width == filter_width \
+                        and zero_padding:
+                    print("transform global conv to fc %s(%s)"
+                          % (op.name, op.type))
+                    op.type = MaceOp.FullyConnected.name
+
+        return False
+
+    def reshape_fc_weight(self):
+        print("Reshape fully connected weight shape")
+        net = self._model
+        filter_format = self.filter_format()
+        for op in net.op:
+            if op.type == MaceOp.FullyConnected.name:
+                weight = self._consts[op.input[1]]
+                if len(weight.dims) == 2:
+                    input_op = self._producer[op.input[0]]
+                    input_shape = list(input_op.output_shape[0].dims)
+                    weight.dims[:] = [weight.dims[0]] + input_shape[1:]
+                    if len(input_shape) == 2:
+                        if filter_format == FilterFormat.HWIO:
+                            weight.dims[:] = [1, 1] + weight.dims[:]
+                        elif filter_format == FilterFormat.OIHW:
+                            weight.dims[:] = weight.dims[:] + [1, 1]
+                        else:
+                            mace_check("FC does not support filter format %s",
+                                       filter_format.name)
+        return False
+
     def transpose_data_format(self):
         net = self._model
 
@@ -896,64 +957,67 @@ class Transformer(base_converter.ConverterInterface):
         net = self._model
         filter_format = self.filter_format()
 
-        print("Transpose filters to OIHW")
-        # transpose filter to OIHW/MIHW for tensorflow (HWIO/HWIM)
-        if filter_format == FilterFormat.HWIO:
+        if self._option.quantize:
+            print("Transpose filters to OHWI")
+            if filter_format == FilterFormat.HWIO:
+                transpose_order = [3, 0, 1, 2]
+            elif filter_format == FilterFormat.OIHW:
+                transpose_order = [0, 2, 3, 1]
+            else:
+                mace_check("Quantize model does not support conv "
+                           "filter format: %s" % filter_format.name)
+
             for op in net.op:
                 if op.type == MaceOp.Conv2D.name \
-                        or op.type == MaceOp.Deconv2D.name \
-                        or op.type == MaceOp.DepthwiseConv2d.name:
+                        or op.type == MaceOp.Deconv2D.name:
                     filter = self._consts[op.input[1]]
                     filter_data = np.array(filter.float_data).reshape(
                         filter.dims)
-                    filter_data = filter_data.transpose(3, 2, 0, 1)
+                    filter_data = filter_data.transpose(transpose_order)
                     filter.float_data[:] = filter_data.flat
                     filter.dims[:] = filter_data.shape
-                if (op.type == MaceOp.MatMul.name and
-                            ConverterUtil.get_arg(op, MaceKeyword.mace_winograd_filter_transformed) is not None):  # noqa
-                    filter = self._consts[op.input[0]]
+
+            self.set_filter_format(FilterFormat.OHWI)
+        else:
+            print("Transpose filters to OIHW/MIHW")
+            # transpose filter to OIHW/MIHW for tensorflow (HWIO/HWIM)
+            if filter_format == FilterFormat.HWIO:
+                for op in net.op:
+                    if op.type == MaceOp.Conv2D.name \
+                            or op.type == MaceOp.Deconv2D.name \
+                            or op.type == MaceOp.DepthwiseConv2d.name:
+                        filter = self._consts[op.input[1]]
+                        filter_data = np.array(filter.float_data).reshape(
+                            filter.dims)
+                        filter_data = filter_data.transpose(3, 2, 0, 1)
+                        filter.float_data[:] = filter_data.flat
+                        filter.dims[:] = filter_data.shape
+                    if (op.type == MaceOp.MatMul.name and
+                                ConverterUtil.get_arg(op, MaceKeyword.mace_winograd_filter_transformed) is not None):  # noqa
+                        filter = self._consts[op.input[0]]
+                        filter_data = np.array(filter.float_data).reshape(
+                            filter.dims)
+                        filter_data = filter_data.transpose(3, 2, 0, 1)
+                        filter.float_data[:] = filter_data.flat
+                        filter.dims[:] = filter_data.shape
+                    if op.type == MaceOp.FullyConnected.name:
+                        weight = self._consts[op.input[1]]
+                        if len(weight.dims) == 4:
+                            weight_data = np.array(weight.float_data).reshape(
+                                weight.dims)
+                            weight_data = weight_data.transpose(3, 2, 0, 1)
+                            weight.float_data[:] = weight_data.flat
+                            weight.dims[:] = weight_data.shape
+
+                self.set_filter_format(FilterFormat.OIHW)
+            for op in net.op:
+                if op.type == MaceOp.Deconv2D.name:
+                    filter = self._consts[op.input[1]]
                     filter_data = np.array(filter.float_data).reshape(
                         filter.dims)
-                    filter_data = filter_data.transpose(3, 2, 0, 1)
+                    filter_data = filter_data.transpose(1, 0, 2, 3)
                     filter.float_data[:] = filter_data.flat
                     filter.dims[:] = filter_data.shape
-                if op.type == MaceOp.FullyConnected.name:
-                    weight = self._consts[op.input[1]]
-                    if len(weight.dims) == 4:
-                        weight_data = np.array(weight.float_data).reshape(
-                            weight.dims)
-                        weight_data = weight_data.transpose(3, 2, 0, 1)
-                        weight.float_data[:] = weight_data.flat
-                        weight.dims[:] = weight_data.shape
-
-            self.set_filter_format(FilterFormat.OIHW)
-        for op in net.op:
-            if op.type == MaceOp.Deconv2D.name:
-                filter = self._consts[op.input[1]]
-                filter_data = np.array(filter.float_data).reshape(
-                    filter.dims)
-                filter_data = filter_data.transpose(1, 0, 2, 3)
-                filter.float_data[:] = filter_data.flat
-                filter.dims[:] = filter_data.shape
-
-        return False
-
-    def reshape_fc_weight(self):
-        print("Reshape fully connected weight shape")
-        net = self._model
-        for op in net.op:
-            if op.type == MaceOp.FullyConnected.name:
-                weight = self._consts[op.input[1]]
-                if len(weight.dims) == 2:
-                    input_op = self._producer[op.input[0]]
-                    input_shape = list(input_op.output_shape[0].dims)
-                    input_data_format = ConverterUtil.data_format(input_op)
-                    weight.dims[:] = [weight.dims[0]] + input_shape[1:]
-                    if len(input_shape) == 2:
-                        weight.dims[:] = weight.dims[:] + [1, 1]
-                    if input_data_format == DataFormat.NHWC and \
-                            len(input_shape) == 4:
-                        self.transpose_shape(weight.dims, [0, 3, 1, 2])
 
         return False
 
@@ -1199,42 +1263,6 @@ class Transformer(base_converter.ConverterInterface):
 
         return False
 
-    def transform_global_conv_to_fc(self):
-        """Transform global conv to fc should be placed after transposing
-        input/output and filter"""
-        # if self._option.device == DeviceType.GPU.value:
-        # return False
-
-        net = self._model
-        for op in net.op:
-            if op.type == MaceOp.Conv2D.name:
-                producer = self._producer[op.input[0]]
-                input_shape = producer.output_shape[0].dims
-                batch, height, width, channels = self.sort_feature_map_shape(
-                    input_shape, ConverterUtil.data_format(producer))
-                filter = self._consts[op.input[1]]
-                filter_shape = filter.dims
-                filter_height, filter_width, in_channels, out_channels = \
-                    self.sort_filter_shape(filter_shape, self.filter_format())
-                zero_padding = True
-                padding_arg = ConverterUtil.get_arg(op,
-                                                    MaceKeyword.mace_padding_str)  # noqa
-                if padding_arg is not None:
-                    if padding_arg.i != PaddingMode.VALID.value:
-                        zero_padding = False
-                else:
-                    padding_value_arg = ConverterUtil.get_arg(op,
-                                                              MaceKeyword.mace_padding_values_str)  # noqa
-                    if padding_value_arg is not None:
-                        if not all(v == 0 for v in padding_value_arg.ints):
-                            zero_padding = False
-
-                if height == filter_height and width == filter_width \
-                        and zero_padding:
-                    print("transform global conv to fc %s(%s)"
-                          % (op.name, op.type))
-                    op.type = MaceOp.FullyConnected.name
-
     def add_device(self):
         # TODO(liuqi) add device definition in OperatorDef
         net = self._model
@@ -1246,6 +1274,9 @@ class Transformer(base_converter.ConverterInterface):
         return False
 
     def update_float_op_data_type(self):
+        if self._option.quantize:
+            return
+
         print("update op with float data type")
         net = self._model
         for op in net.op: