Merge pull request #5 from PaddlePaddle/develop

update

Merge pull request #5 from PaddlePaddle/develop
update
84581b17 · channings · GitHub · 2ec20d64 · a72829d0 · 84581b17
12 changed file
--- a/README.md
+++ b/README.md
@@ -5,7 +5,7 @@ X2Paddle支持将其余深度学习框架训练得到的模型，转换至Paddle
 X2Paddle is a toolkit for converting trained model to PaddlePaddle from other deep learning frameworks.
 ## 转换模型库
-X2Paddle在多个主流的CV模型上，测试过TensorFlow/Caffe/ONNX模型的转换，可以在[X2Paddle-Model-Zoo](x2paddle_model_zoo.md)查看我们的模型测试列表。如果你在新的模型上进行了测试转换，也欢迎继续补充该列表；如若无法转换，可通过ISSUE反馈给我们，我们会尽快跟进。
+X2Paddle在多个主流的CV模型上，测试过TensorFlow/Caffe/ONNX模型的转换，可以在[X2Paddle-Model-Zoo](x2paddle_model_zoo.md)查看我们的模型测试列表，可以在[OP-LIST](op_list.md)中查看目前X2Paddle支持的OP列表。如果你在新的模型上进行了测试转换，也欢迎继续补充该列表；如若无法转换，可通过ISSUE反馈给我们，我们会尽快跟进。
 ## 环境依赖
@@ -19,18 +19,6 @@ onnx ： onnx == 1.5.0  onnxruntime == 0.4.0
 ## 安装
 ### 安装方式一（推荐）
-使用最新的代码版本，可使用如下方式进行安装  
-```
-pip install git+https://github.com/PaddlePaddle/X2Paddle.git@develop
-```
-### 安装方式二
-我们会定期更新pip源上的x2paddle版本
-```
-pip install x2paddle
-```
-### 安装方式三
 ```
 git clone https://github.com/PaddlePaddle/X2Paddle.git
 cd X2Paddle
@@ -38,6 +26,11 @@ git checkout develop
 python setup.py install
 ```
+### 安装方式二
+我们会定期更新pip源上的x2paddle版本
+```
+pip install x2paddle --index https://pypi.Python.org/simple/
+```
 ## 使用方法
 ### TensorFlow
 ```
@@ -45,7 +38,7 @@ x2paddle --framework=tensorflow --model=tf_model.pb --save_dir=pd_model
 ```
 ### Caffe
 ```
-x2paddle --framework=caffe --prototxt=deploy.proto --weight=deploy.caffemodel --save_dir=pd_model
+x2paddle --framework=caffe --prototxt=deploy.prototxt --weight=deploy.caffemodel --save_dir=pd_model
 ```
 ### ONNX
 ```

--- a/op_list.md
+++ b/op_list.md
+# X2Paddle支持OP列表
+> 目前X2Paddle支持40+的TensorFlow OP，30+的Caffe Layer，覆盖了大部分CV分类模型常用的操作。我们在如下列表中给出了目前X2Paddle支持的全部OP。
+**注：** 目前，部分OP暂未支持，如您在转换过程中出现OP不支持的情况，可自行添加或反馈给我们。欢迎通过[ISSUE反馈](https://github.com/PaddlePaddle/X2Paddle/issues/new)的方式告知我们(模型名，代码实现或模型获取方式)，我们会及时跟进：）
+## TensorFlow
+| 序号 | OP | 序号 | OP | 序号 | OP | 序号 | OP |
+|------|------|------|------|------|------|------|------|
+| 1  | Relu        | 2  | Relu6     | 3  | Shape     | 4  | Abs                   |
+| 5  | Sigmoid     | 6  | Exp       | 7  | Rsqrt     | 8  | swish_f32             |
+| 9  | Tanh        | 10 | LeakyRelu | 11 | Add       | 12 | RealDiv               |
+| 13 | Sub         | 14 | Maximum   | 15 | Mul       | 16 | FloorDiv              |
+| 17 | Placeholder | 18 | Const     | 19 | Transpose | 20 | FusedBatchNorm        |
+| 21 | Conv2D      | 22 | BiasAdd   | 23 | MaxPool   | 24 | DepthwiseConv2dNative |
+| 25 | Reshape     | 26 | AvgPool   | 27 | SplitV    | 28 | SquaredDifference     |
+| 29 | Tile        | 30 | Pack      | 31 | Pad       | 32 | ResizeBilinear        |
+| 33 | Mean        | 34 | MatMul    | 35 | ArgMax    | 36 | StridedSlice          |
+| 37 | Slice       | 38 | Sum       | 39 | Max       | 40 | Conv2DBackpropInput   |
+| 41 | Cast        | 42 | Split     | 43 | Squeeze   | 44 | ResizeNearestNeighbor |
+| 45 | Softmax     | 46 | Range     | 47 | ConcatV2  |
+## Caffe
+| 序号 | OP | 序号 | OP | 序号 | OP | 序号 | OP |
+|------|------|------|------|------|------|------|------|
+| 1  | Input     | 2  | Convolution  | 3  | Deconvolution  | 4  | Pooling              |
+| 5  | LRN       | 6  | InnerProduct | 7  | Softmax        | 8  | Slice                |
+| 9  | Concat    | 10 | PReLU        | 11 | Accuracy       | 12 | Eltwise              |
+| 13 | BatchNorm | 14 | Scale        | 15 | Reshape        | 16 | ArgMax               |
+| 17 | Crop      | 18 | Flatten      | 19 | Power          | 20 | Reduction            |
+| 21 | Axpy      | 22 | ROIPolling   | 23 | Permute        | 24 | DetectionOutput      |
+| 25 | Normalize | 26 | Select       | 27 | ShuffleChannel | 28 | ConvolutionDepthwise |
+| 29 | ReLU      | 30 | AbsVal       | 31 | Sigmoid        | 32 | TanH                 |
+## ONNX
+| 序号 | OP | 序号 | OP | 序号 | OP | 序号 | OP |
+|------|------|------|------|------|------|------|------|
+| 1  | Relu     | 2  | LeakyRelu | 3  | Elu       | 4  | ThresholdedRelu    |
+| 5  | Prelu    | 6  | Tanh      | 7  | Shrink    | 8  | Sigmoid            |
+| 9  | Pow      | 10 | Softplus  | 11 | Softsign  | 12 | HardSigmoid        |
+| 13 | Exp      | 14 | Add       | 15 | Div       | 16 | Sub                |
+| 17 | Mul      | 18 | Shape     | 19 | Clip      | 20 | AveragePool        |
+| 21 | Sqrt     | 22 | ReduceSum | 23 | ReduceMin | 24 | ReduceMean         |
+| 25 | Constant | 26 | Pad       | 27 | Unsqueeze | 28 | Resize             |
+| 29 | Upsample | 30 | Expand    | 31 | Gather    | 32 | Slice              |
+| 33 | Cast     | 34 | Split     | 35 | Reshape   | 36 | ConstantOfShape    |
+| 37 | Ceil     | 38 | Concat    | 39 | Flatten   | 40 | ConvTranspose      |
+| 41 | MatMul   | 42 | Sum       | 43 | Transpose | 44 | BatchNormalization |
+| 45 | Squeeze  | 46 | Equal     | 47 | Identity  | 48 | GlobalAveragePool  |
+| 49 | MaxPool  | 50 | Conv      | 51 | Gemm      |
--- a/x2paddle/convert.py
+++ b/x2paddle/convert.py
@@ -104,10 +104,14 @@ def tf2paddle(model_path,
        # neccesary optimization
        optimizer.delete_redundance_code()
        # optimizer below is experimental
+        optimizer.optimize_elementwise_op()
        optimizer.merge_activation()
        optimizer.merge_bias()
-        optimizer.merge_batch_norm()
+        optimizer.optimize_sub_graph()
-        optimizer.merge_prelu()
+#        optimizer.merge_batch_norm()
+#        optimizer.merge_prelu()
    else:
        mapper = TFOpMapperNHWC(model)
        optimizer = TFOptimizer(mapper)
@@ -125,9 +129,12 @@ def caffe2paddle(proto, weight, save_dir, caffe_proto):
    from x2paddle.op_mapper.caffe_op_mapper import CaffeOpMapper
    from x2paddle.optimizer.caffe_optimizer import CaffeOptimizer
    import google.protobuf as gpb
-    ver_str = gpb.__version__.replace('.', '')
+    ver_part = gpb.__version__.split('.')
-    ver_int = int(ver_str[0:2])
+    version_satisfy = False
-    assert ver_int >= 36, 'The version of protobuf must be larger than 3.6.0!'
+    if (int(ver_part[0]) == 3 and int(ver_part[1]) >= 6) \
+        or (int(ver_part[0]) > 3):
+        version_satisfy = True
+    assert version_satisfy, 'google.protobuf >= 3.6.0 is required'
    print("Now translating model from caffe to paddle.")
    model = CaffeDecoder(proto, weight, caffe_proto)
    mapper = CaffeOpMapper(model)

--- a/x2paddle/decoder/tf_decoder.py
+++ b/x2paddle/decoder/tf_decoder.py
@@ -60,6 +60,15 @@ class TFGraphNode(GraphNode):
            raise Exception("Dtype[{}] not in dtype_map".format(dtype))
        return self.dtype_map[dtype]
+    @property
+    def raw_dtype(self):
+        keys = ['dtype', 'Tidx', 'T', 'DstT']
+        for k in keys:
+            dtype = self.layer.attr[k].type
+            if dtype > 0:
+                break
+        return dtype
    @property
    def value(self):
        assert self.layer_type == "Const", "Only Const node has value."
@@ -120,6 +129,7 @@ class TFGraph(Graph):
        # tensorflow graph optimize
        self._remove_isolated_node()
        self._remove_identity_node()
+        self._remove_cast_node()
    def get_node(self, node_name, copy=False):
        items = node_name.strip().split(':')
@@ -190,6 +200,27 @@ class TFGraph(Graph):
                idx = self.output_nodes.index(node_name)
                self.output_nodes[idx] = input_node.layer_name
+    def _remove_cast_node(self):
+        cast_node = list()
+        for node_name, node in self.node_map.items():
+            if node.layer_type == "Cast":
+                input = self.get_node(node.inputs[0])
+                if input.layer_type != "Placeholder" or len(input.outputs) != 1:
+                    continue
+                cast_node.append(node_name)
+        for node_name in cast_node:
+            node = self.get_node(node_name)
+            input_node = self.get_node(node.inputs[0])
+            input_node.layer.attr["dtype"].type = node.raw_dtype
+            self.remove_node(node_name)
+            self.identity_map[node_name] = input_node.layer_name
+            if node_name in self.output_nodes:
+                idx = self.output_nodes.index(node_name)
+                self.output_nodes[idx] = input_node.layer_name
    def data_format_propagation(self, node):
        current_node = self.node_map[node.layer_name]
        current_node = node.tf_data_format
@@ -281,7 +312,11 @@ class TFDecoder(object):
                right_shape_been_input = False
                while not right_shape_been_input:
-                    shape = input("Shape of Input(e.g. None,224,224,3): ")
+                    try:
+                        shape = raw_input(
+                            "Shape of Input(e.g. None,224,224,3): ")
+                    except:
+                        shape = input("Shape of Input(e.g. None,224,224,3): ")
                    if shape.count("None") > 1:
                        print("Only 1 dimension can be None, type again:)")
                    else:

--- a/x2paddle/op_mapper/caffe_custom_layer/register.py
+++ b/x2paddle/op_mapper/caffe_custom_layer/register.py
@@ -31,7 +31,6 @@ def register(kind, shape, layer, weights):
            k) is str, 'invalid param "kind" for register, not a list of str'
        assert k not in g_custom_layers, 'this type[%s] has already been registered' % (
            k)
-        print('register layer[%s]' % (k))
        g_custom_layers[k] = {
            'shape': shape,
            'layer': layer,

--- a/x2paddle/op_mapper/caffe_custom_layer/shufflechannel.py
+++ b/x2paddle/op_mapper/caffe_custom_layer/shufflechannel.py
@@ -8,13 +8,7 @@ def shufflechannel_shape(input_shape):
 def shufflechannel_layer(inputs, group=None, input_shape=None, name=None):
    input = inputs[0]
-    c_fm = fluid.layers.split(input, num_or_sections=input_shape[0][1], dim=1)
+    out = fluid.layers.shuffle_channel(x=input, group=group)
-    size = int(input_shape[0][1] / group)
-    new_c_fm = []
-    for i in range(size):
-        for j in range(group):
-            new_c_fm.append(c_fm[j * size + i])
-    out = fluid.layers.concat(new_c_fm, axis=1)
    return out

--- a/x2paddle/op_mapper/caffe_op_mapper.py
+++ b/x2paddle/op_mapper/caffe_op_mapper.py
@@ -124,9 +124,6 @@ class CaffeOpMapper(OpMapper):
            data[idx] = np.squeeze(d, axis=sq_axis)
            shape_new = data[idx].shape
-            if len(shape_old) != shape_new:
-                print('squeeze idx:%d, with kind:%s,name:%s' % \
-                        (idx, node.layer_type, node.layer.name))
        return data
    def get_kernel_parameters(self, kind, params):
@@ -366,7 +363,7 @@ class CaffeOpMapper(OpMapper):
        input = self.graph.get_bottom_node(node, idx=0, copy=True)
        attr = {
            'n': params.local_size,
-            'k': 1.0,
+            'k': params.k,
            'alpha': alpha,
            'beta': params.beta,
            'name': string(node.layer_name)
@@ -453,35 +450,19 @@ class CaffeOpMapper(OpMapper):
        slice_dim = params.slice_dim
        if slice_dim != 1 and axis == 1:
            axis = slice_dim
-        points = list(params.slice_point)
+        output_shape = node.output_shape
+        sections_list = []
-        if len(points) == 0:
+        for s in output_shape:
-            dims = node.input_shape[0][axis]
+            sections_list.append(s[axis])
-            assert dims % top_len == 0, "the parameter of Slice is wrong"
+        attr = {
-            part = dims / top_len
+            'num_or_sections': sections_list,
-            t = part
+            'dim': axis,
-            while t < dims:
+            'name': string(node.layer_name)
-                points.append(int(t))
+        }
-                t += part
+        node.fluid_code.add_layer("split",
-        maxint32 = 2147483647
+                                  inputs=input,
-        points = [0] + points
+                                  output=node.layer_name,
-        points.append(maxint32)
+                                  param_attr=attr)
-        i = 0
-        node.fluid_code.add_note('{} = []'.format(node.layer_name))
-        for i in range(len(points)):
-            attr = {
-                'axes': [axis],
-                'starts': [points[i]],
-                'ends': [points[i + 1]]
-            }
-            node.fluid_code.add_layer("slice",
-                                      inputs=input,
-                                      output=node.layer_name + '_' + str(i),
-                                      param_attr=attr)
-            node.fluid_code.add_note('{}.append({})'.format(
-                node.layer_name, node.layer_name + '_' + str(i)))
-            if i == len(points) - 2:
-                break
    def Concat(self, node):
        assert len(
@@ -652,7 +633,8 @@ class CaffeOpMapper(OpMapper):
            ]).astype('float32')
            scale = 0
        else:
-            node.data = [np.squeeze(i) for i in node.data]
+            node.data = [np.squeeze(i).astype('float32') for i in node.data]
            mean, variance, scale = node.data
        # Prescale the stats
        scaling_factor = 1.0 / scale if scale != 0 else 0
@@ -687,8 +669,10 @@ class CaffeOpMapper(OpMapper):
                input_c,
            ]).astype('float32')
        else:
-            self.weights[node.layer_name + '_scale'] = np.squeeze(node.data[0])
+            self.weights[node.layer_name + '_scale'] = np.squeeze(
-            self.weights[node.layer_name + '_offset'] = np.squeeze(node.data[1])
+                node.data[0]).astype('float32')
+            self.weights[node.layer_name + '_offset'] = np.squeeze(
+                node.data[1]).astype('float32')
        params = node.layer.scale_param
        axis = params.axis
        num_axes = params.num_axes
@@ -956,7 +940,6 @@ class CaffeOpMapper(OpMapper):
            input = self.graph.get_bottom_node(node, idx=i, copy=True)
            if i == 1 and op == 'DetectionOutput':
                input = self.graph.get_bottom_node(node, idx=i, copy=True)
-                print(input.layer_type)
                while input is not None and input.layer_type != 'Softmax':
                    input = self.graph.get_bottom_node(input, idx=0, copy=True)
                assert input is not None, 'This kind of DetectionOutput is not supported!'

--- a/x2paddle/op_mapper/onnx_custom_layer/register.py
+++ b/x2paddle/op_mapper/onnx_custom_layer/register.py
@@ -44,7 +44,6 @@ def register(kind, shape, layer, child_func, weights):
            k) is str, 'invalid param "kind" for register, not a list of str'
        assert k not in g_custom_layers, 'this type[%s] has already been registered' % (
            k)
-        print('register layer[%s]' % (k))
        g_custom_layers[k] = {
            'shape': shape,
            'layer': layer,

--- a/x2paddle/op_mapper/tf_op_mapper.py
+++ b/x2paddle/op_mapper/tf_op_mapper.py
@@ -168,9 +168,34 @@ class TFOpMapper(OpMapper):
                x_input = y
                y_input = x
                x_shape = y.out_shapes[0]
+                if len(x_shape) == 0:
+                    x_shape = [1]
                y_shape = x.out_shapes[0]
+                if len(y_shape) == 0:
+                    y_shape = [1]
            else:
-                raise Exception("Unexpected situation happend")
+                if len(x_shape) == 1 and len(y_shape) == 4 and x_shape[
+                        0] == y_shape[-1] and y_shape.count(-1) < 1:
+                    shape = [1, x_shape[0], 1, 1]
+                    attr = {"shape": shape}
+                    node.fluid_code.add_layer("reshape",
+                                              inputs=x_input,
+                                              output="reshape_x",
+                                              param_attr=attr)
+                    if y_shape[0] != 1:
+                        attr = {"expand_times": [y_shape[0], 1, 1, 1]}
+                        node.fluid_code.add_layer("expand",
+                                                  inputs="reshape_x",
+                                                  output="reshape_x",
+                                                  param_attr=attr)
+                    inputs = {"x": "reshape_x", "y": y_input}
+                    node.fluid_code.add_layer(op_type,
+                                              inputs=inputs,
+                                              output=node,
+                                              param_attr=None)
+                    return
+                else:
+                    raise Exception("Unexpected situation happend")
        if len(x_shape) == 4 and len(y_shape) == 1:
            if x_input.tf_data_format == "NHWC":
@@ -985,7 +1010,7 @@ class TFOpMapper(OpMapper):
        attr = {
            "bias_attr": False,
            "param_attr": string(kernel.layer_name),
-            "num_filters": k_size[3],
+            "num_filters": k_size[2],
            "filter_size": k_size[0:2],
            "stride": strides[2:4],
            "dilation": dilations[2:4],
@@ -1091,40 +1116,6 @@ class TFOpMapper(OpMapper):
                                  output=node,
                                  param_attr=attr)
-    def ResizeNearestNeighbor(self, node):
-        input = self.graph.get_node(node.layer.input[0], copy=True)
-        resize_shape = self.graph.get_node(node.layer.input[1], copy=True)
-        self.add_omit_nodes(resize_shape.layer_name, node.layer_name)
-        if resize_shape.layer_type == "Const":
-            resize_shape = resize_shape.value.tolist()
-        else:
-            resize_shape = self.decoder.infer_shape_tensor(resize_shape)
-        align_corners = node.get_attr("align_corners")
-        attr = {"align_corners": align_corners, "out_shape": resize_shape}
-        node.fluid_code.add_layer("resize_nearest",
-                                  inputs=input,
-                                  output=node,
-                                  param_attr=attr)
-    def ResizeBilinear(self, node):
-        input = self.graph.get_node(node.layer.input[0], copy=True)
-        resize_shape = self.graph.get_node(node.layer.input[1], copy=True)
-        self.add_omit_nodes(resize_shape.layer_name, node.layer_name)
-        if resize_shape.layer_type == "Const":
-            resize_shape = resize_shape.value.tolist()
-        else:
-            resize_shape = self.decoder.infer_shape_tensor(resize_shape)
-        align_corners = node.get_attr("align_corners")
-        attr = {
-            "align_corners": align_corners,
-            "out_shape": resize_shape,
-            "align_mode": 1
-        }
-        node.fluid_code.add_layer("resize_bilinear",
-                                  inputs=input,
-                                  output=node,
-                                  param_attr=attr)
    def ResizeNearestNeighbor(self, node):
        input = self.graph.get_node(node.layer.input[0], copy=True)
        resize_shape = self.graph.get_node(node.layer.input[1], copy=True)
@@ -1170,37 +1161,6 @@ class TFOpMapper(OpMapper):
                                  output=node,
                                  param_attr=None)
-    def RandomUniform(self, node):
-        shape = self.graph.get_node(node.layer.input[0], copy=True)
-        self.add_omit_nodes(shape.layer_name, node.layer_name)
-        if shape.layer_type == "Const":
-            shape = shape.value.tolist()
-        else:
-            shape = self.decoder.infer_shape_tensor(shape)
-        if node.tf_data_format == "NHWC" and len(shape) == 4:
-            shape = [shape[i] for i in [0, 3, 1, 2]]
-        attr = {"shape": shape, "min": 0.0, "max": 0.9999}
-        if shape[0] < 0:
-            input = self.batch_node
-            node.fluid_code.add_layer("uniform_random_batch_size_like",
-                                      inputs=input,
-                                      output=node,
-                                      param_attr=attr)
-        else:
-            node.fluid_code.add_layer("uniform_random",
-                                      inputs=None,
-                                      output=node,
-                                      param_attr=attr)
-    def GreaterEqual(self, node):
-        x = self.graph.get_node(node.layer.input[0], copy=True)
-        y = self.graph.get_node(node.layer.input[1], copy=True)
-        inputs = {"x": x, "y": y}
-        node.fluid_code.add_layer("greater_equal",
-                                  inputs=inputs,
-                                  output=node,
-                                  param_attr=None)
    def RandomUniform(self, node):
        shape = self.graph.get_node(node.layer.input[0], copy=True)
        self.add_omit_nodes(shape.layer_name, node.layer_name)

--- a/x2paddle/op_mapper/tf_op_mapper_nhwc.py
+++ b/x2paddle/op_mapper/tf_op_mapper_nhwc.py
@@ -41,6 +41,7 @@ class TFOpMapperNHWC(OpMapper):
        'Exp': ['exp'],
        'Rsqrt': ['rsqrt'],
        'swish_f32': ['swish'],
+        'Tanh': ['tanh'],
        'LeakyRelu': ['leaky_relu', {
            'alpha': 'alpha'
        }]
@@ -120,10 +121,29 @@ class TFOpMapperNHWC(OpMapper):
            pd_param_name = list(param.values())[0]
            tf_param = node.get_attr(tf_param_name)
            attr[pd_param_name] = tf_param
-        node.fluid_code.add_layer(op_info[0],
-                                  inputs=input,
+        if len(input.out_shapes[0]) == 4 and op_info[0] != 'shape':
-                                  output=node,
+            attr1 = {"perm": [0, 3, 1, 2]}
-                                  param_attr=attr)
+            node.fluid_code.add_layer('transpose',
+                                      inputs=input,
+                                      output=node,
+                                      param_attr=attr1)
+            input = node
+            node.fluid_code.add_layer(op_info[0],
+                                      inputs=input,
+                                      output=node,
+                                      param_attr=attr)
+            input = node
+            attr2 = {"perm": [0, 2, 3, 1]}
+            node.fluid_code.add_layer('transpose',
+                                      inputs=input,
+                                      output=node,
+                                      param_attr=attr2)
+        else:
+            node.fluid_code.add_layer(op_info[0],
+                                      inputs=input,
+                                      output=node,
+                                      param_attr=attr)
    def elementwise_map(self, node):
        assert node.layer_type in self.elementwise_ops
@@ -148,7 +168,11 @@ class TFOpMapperNHWC(OpMapper):
                x_input = y
                y_input = x
                x_shape = y.out_shapes[0]
+                if len(x_shape) == 0:
+                    x_shape = [1]
                y_shape = x.out_shapes[0]
+                if len(y_shape) == 0:
+                    y_shape = [1]
            else:
                raise Exception("Unexpected situation happend")
@@ -192,11 +216,30 @@ class TFOpMapperNHWC(OpMapper):
                                          output="y_tmp",
                                          param_attr=attr)
                y_input = "y_tmp"
-        inputs = {"x": x_input, "y": y_input}
+        if len(x_shape) == 4 and len(y_shape) == 4:
-        node.fluid_code.add_layer(op_type,
+            node.fluid_code.add_layer("transpose",
-                                  inputs=inputs,
+                                      inputs=x_input,
-                                  output=node,
+                                      output=x_input,
-                                  param_attr=None)
+                                      param_attr={'perm': [0, 3, 1, 2]})
+            node.fluid_code.add_layer("transpose",
+                                      inputs=y_input,
+                                      output=y_input,
+                                      param_attr={'perm': [0, 3, 1, 2]})
+            inputs = {"x": x_input, "y": y_input}
+            node.fluid_code.add_layer(op_type,
+                                      inputs=inputs,
+                                      output=node,
+                                      param_attr=None)
+            node.fluid_code.add_layer("transpose",
+                                      inputs=node,
+                                      output=node,
+                                      param_attr={'perm': [0, 2, 3, 1]})
+        else:
+            inputs = {"x": x_input, "y": y_input}
+            node.fluid_code.add_layer(op_type,
+                                      inputs=inputs,
+                                      output=node,
+                                      param_attr=None)
    def Placeholder(self, node):
        shape = node.out_shapes[0]
@@ -913,6 +956,12 @@ class TFOpMapperNHWC(OpMapper):
        self.add_omit_nodes(kernel.layer_name, node.layer_name)
        self.add_omit_nodes(out_shape.layer_name, node.layer_name)
+        if out_shape.layer_type == "Const":
+            out_shape = out_shape.value.tolist()
+        else:
+            out_shape = self.decoder.infer_shape_tensor(out_shape,
+                                                        node.out_shapes[0])
        in_shape = input.out_shapes[0]
        if in_shape.count(-1) > 2:
            in_shape = self.decoder.infer_tensor(input).shape
@@ -920,7 +969,7 @@ class TFOpMapperNHWC(OpMapper):
        if k_size.count(-1) > 2:
            k_size = self.decoder.infer_tensor(kernel).shape
-        pad_mode = node.get_attr("padding")
+        pad_mode = node.get_attr("padding").decode()
        strides = node.get_attr("strides")
        dilations = node.get_attr("dilations")
        data_format = node.get_attr("data_format").decode()
@@ -958,7 +1007,7 @@ class TFOpMapperNHWC(OpMapper):
        attr = {
            "bias_attr": False,
            "param_attr": string(kernel.layer_name),
-            "num_filters": k_size[3],
+            "num_filters": k_size[2],
            "filter_size": k_size[0:2],
            "stride": strides[2:4],
            "dilation": dilations[2:4],
@@ -969,6 +1018,22 @@ class TFOpMapperNHWC(OpMapper):
                                  output=node,
                                  param_attr=attr)
+        if pad_mode == "SAME":
+            if node.tf_data_format == "NHWC":
+                out_shape = [out_shape[i] for i in [0, 3, 1, 2]]
+            for i in range(4):
+                if out_shape[i] < 0:
+                    out_shape[i] = 999999
+            attr = {
+                "axes": [0, 1, 2, 3],
+                "starts": [0, 0, 0, 0],
+                "ends": out_shape
+            }
+            node.fluid_code.add_layer("slice",
+                                      inputs=node,
+                                      output=node,
+                                      param_attr=attr)
        if not channel_first:
            attr = {"perm": [0, 2, 3, 1]}
            node.fluid_code.add_layer("transpose",
@@ -1127,3 +1192,17 @@ class TFOpMapperNHWC(OpMapper):
                                      inputs=None,
                                      output=node,
                                      param_attr=attr)
+    def SquaredDifference(self, node):
+        x = self.graph.get_node(node.layer.input[0], copy=True)
+        y = self.graph.get_node(node.layer.input[1], copy=True)
+        inputs = {"x": x, "y": y}
+        node.fluid_code.add_layer("elementwise_sub",
+                                  inputs=inputs,
+                                  output=node,
+                                  param_attr=None)
+        inputs = {"x": node, "y": node}
+        node.fluid_code.add_layer("elementwise_mul",
+                                  inputs=inputs,
+                                  output=node,
+                                  param_attr=None)
--- a/x2paddle/optimizer/tf_optimizer.py
+++ b/x2paddle/optimizer/tf_optimizer.py
@@ -16,10 +16,20 @@
 from x2paddle.op_mapper.tf_op_mapper import TFOpMapper
 from x2paddle.core.fluid_code import Layer
 from x2paddle.core.util import *
+import six
 import numpy
 import copy as cp
+def exist_act(node):
+    for layer in node.fluid_code.layers:
+        if layer.param_attr is not None:
+            act = layer.param_attr.get("act", None)
+            if act is not None:
+                return True
+    return False
 class TFOptimizer(object):
    activation_ops = {
        'Relu': 'relu',
@@ -95,6 +105,59 @@ class TFOptimizer(object):
                    del out_node.inputs[index]
                del self.graph.node_map[node_name]
+    def optimize_elementwise_op(self):
+        elementwise_ops = [
+            'Sub', 'Add', 'RealDiv', 'Maximum', 'Mul', 'FloorDiv',
+            'GreaterEqual'
+        ]
+        revertable_ops = ['Add', 'Mul']
+        for node_name in self.graph.topo_sort:
+            node = self.graph.get_node(node_name)
+            if node is None:
+                continue
+            if node.layer_type in elementwise_ops:
+                if len(node.fluid_code.layers) != 2:
+                    continue
+                if node.fluid_code.layers[0].op != "expand":
+                    continue
+                expand_out = node.fluid_code.layers[0].output
+                expand_in = node.fluid_code.layers[0].inputs
+                expand_times = node.fluid_code.layers[0].param_attr[
+                    "expand_times"]
+                x = node.fluid_code.layers[1].inputs["x"]
+                y = node.fluid_code.layers[1].inputs["y"]
+                if isinstance(
+                        x,
+                        six.string_types) and node.layer_type in revertable_ops:
+                    node.fluid_code.layers[1].inputs["y"] = x
+                    node.fluid_code.layers[1].inputs["x"] = y
+                    x = node.fluid_code.layers[1].inputs["x"]
+                    y = expand_in
+                elif isinstance(y, six.string_types):
+                    y = expand_in
+                else:
+                    continue
+                x_shape = x.out_shapes[0]
+                y_shape = y.out_shapes[0]
+                if len(x_shape) != len(y_shape):
+                    continue
+                if len(x_shape) == 4:
+                    x_shape = [x_shape[i] for i in [0, 3, 1, 2]]
+                    y_shape = [y_shape[i] for i in [0, 3, 1, 2]]
+                continue_flag = True
+                for i in range(len(x_shape)):
+                    if y_shape[-1 * (i + 1)] == 1 and continue_flag:
+                        expand_times[-1 * (i + 1)] = 1
+                    else:
+                        continue_flag = False
+                if expand_times.count(1) == len(expand_times):
+                    node.fluid_code.layers[1].inputs["y"] = expand_in
+                    del node.fluid_code.layers[0]
    def merge_activation(self):
        act_nodes = list()
        for node_name in self.graph.topo_sort:
@@ -169,84 +232,35 @@ class TFOptimizer(object):
                                'act']
                    node.fluid_code.clear()
                    self.graph.remove_node(node.layer_name)
+                    self.graph.identity_map[node.layer_name] = input.layer_name
    def remove_transpose(self):
        graph_copy = cp.deepcopy(self.graph)
        nhwc_insensitive_ops = [
            'Relu', 'Relu6', 'Abs', 'Sigmoid', 'Exp', 'Rsqrt', 'swish_f32',
-            'LeakyRelu', 'Cast'
+            'LeakyRelu', 'Cast', 'Tanh'
        ]
        elementwise_ops = [
            'Sub', 'Add', 'RealDiv', 'Maximum', 'Mul', 'FloorDiv',
            'GreaterEqual'
        ]
-        for node_name in self.graph.topo_sort:
-            node = graph_copy.get_node(node_name)
-            if node is None:
-                continue
-            if node.layer_type in nhwc_insensitive_ops:
-                graph_copy.remove_node(node_name)
        optimize_ops = [
            'Conv2D', 'MaxPool', 'FusedBatchNorm', 'DepthwiseConv2dNative',
            'AvgPool', 'Pad', 'Conv2DBackpropInput', 'ResizeNearestNeighbor',
            'ResizeBilinear', "Placeholder"
        ]
+        can_be_optimized_ops = [
+            'Conv2D', 'MaxPool', 'FusedBatchNorm', 'DepthwiseConv2dNative',
+            'AvgPool', 'Pad', 'Conv2DBackpropInput', 'ResizeNearestNeighbor',
+            'ResizeBilinear', "Placeholder", 'Relu', 'Relu6', 'Abs', 'Sigmoid',
+            'Exp', 'Rsqrt', 'swish_f32', 'LeakyRelu', 'Cast', 'Tanh'
+        ]
        for node_name in self.graph.topo_sort:
            node = graph_copy.get_node(node_name)
            if node is None:
                continue
-            if node.layer_type in elementwise_ops:
+            if node.layer_type in can_be_optimized_ops:
-                is_nhwc = True
-                for in_name in node.inputs:
-                    in_node = graph_copy.get_node(in_name)
-                    if hasattr(in_node, "is_nhwc"):
-                        if not in_node.is_nhwc:
-                            is_nhwc = False
-                    else:
-                        if len(in_node.fluid_code.layers) < 2:
-                            is_nhwc = False
-                            continue
-                        if in_node.fluid_code.layers[
-                                -1].op != "transpose" or in_node.fluid_code.layers[
-                                    -1].param_attr["perm"] != [0, 2, 3, 1]:
-                            is_nhwc = False
-                            continue
-                node.is_nhwc = is_nhwc
-        for i in range(len(self.graph.topo_sort)):
-            node_name = self.graph.topo_sort[-1 * i - 1]
-            node = graph_copy.get_node(node_name)
-            if node is None:
-                continue
-            if node.layer_type in elementwise_ops:
-                can_be_removed = True
-                if len(node.fluid_code.layers) > 1:
-                    can_be_removed = False
-                if not node.is_nhwc:
-                    can_be_removed = False
-                for out_name in node.outputs:
-                    out_node = graph_copy.get_node(out_name)
-                    if hasattr(out_node, "is_nhwc"):
-                        if not out_node.is_nhwc:
-                            can_be_removed = False
-                    else:
-                        if len(out_node.fluid_code.layers) < 2:
-                            can_be_removed = False
-                            break
-                        if out_node.fluid_code.layers[
-                                0].op != "transpose" or out_node.fluid_code.layers[
-                                    0].param_attr["perm"] != [0, 3, 1, 2]:
-                            can_be_removed = False
-                            break
-                node.can_be_removed = can_be_removed
-        for node_name in self.graph.topo_sort:
-            node = graph_copy.get_node(node_name)
-            if node is None:
-                continue
-            if node.layer_type in optimize_ops:
                if node.fluid_code.layers[
                        -1].op != "transpose" or node.fluid_code.layers[
                            -1].param_attr["perm"] != [0, 2, 3, 1]:
@@ -264,6 +278,9 @@ class TFOptimizer(object):
                                0].param_attr["perm"] != [0, 3, 1, 2]:
                        can_be_removed = False
                        break
+                    elif out_node.layer_type in elementwise_ops:
+                        can_be_removed = False
+                        break
                if can_be_removed and len(node.fluid_code.layers) > 1:
                    true_node = self.graph.get_node(node_name)
                    if true_node.layer_type == "Placeholder":
@@ -283,8 +300,6 @@ class TFOptimizer(object):
                    del true_node.fluid_code.layers[-1]
                    for out_name in output_names:
                        out_node = self.graph.get_node(out_name)
-                        if out_node.layer_type in elementwise_ops:
-                            continue
                        out_node.fluid_code.layers[
                            1].inputs = out_node.fluid_code.layers[0].inputs
                        del out_node.fluid_code.layers[0]
@@ -294,50 +309,248 @@ class TFOptimizer(object):
            if node is None:
                continue
            if node.layer_type in elementwise_ops:
-                if not node.can_be_removed:
+                can_be_removed = True
+                if node.fluid_code.layers[
+                        -1].op != "transpose" or node.fluid_code.layers[
+                            -1].param_attr["perm"] != [0, 2, 3, 1]:
+                    continue
+                can_be_removed = True
+                output_names = node.outputs
+                for out_name in output_names:
+                    out_node = graph_copy.get_node(out_name)
+                    if len(out_node.fluid_code.layers) < 3:
+                        can_be_removed = False
+                        break
+                    if hasattr(out_node, "can_be_removed"):
+                        if not out_node.can_be_removed:
+                            can_be_removed = False
+                            break
+                    if out_node.layer_type in can_be_optimized_ops:
+                        if out_node.fluid_code.layers[
+                                0].op != "transpose" or out_node.fluid_code.layers[
+                                    0].param_attr["perm"] != [0, 3, 1, 2]:
+                            can_be_removed = False
+                            break
+                    elif out_node.layer_type in elementwise_ops:
+                        if out_node.fluid_code.layers[
+                                0].op != "transpose" and out_node.fluid_code.layers[
+                                    1].op != "transpose":
+                            can_be_removed = False
+                            break
+                        if out_node.fluid_code.layers[0].op == "transpose":
+                            if out_node.fluid_code.layers[0].param_attr[
+                                    "perm"] != [0, 3, 1, 2]:
+                                can_be_removed = False
+                                break
+                        if out_node.fluid_code.layers[1].op == "transpose":
+                            if out_node.fluid_code.layers[1].param_attr[
+                                    "perm"] != [0, 3, 1, 2]:
+                                can_be_removed = False
+                                break
+                if can_be_removed and len(node.fluid_code.layers) > 1:
                    true_node = self.graph.get_node(node_name)
-                    for i, in_name in enumerate(node.inputs):
+                    true_node.fluid_code.layers[
-                        in_node = graph_copy.get_node(in_name)
+                        -2].output = true_node.fluid_code.layers[-1].output
-                        if hasattr(in_node, "is_nhwc") and in_node.is_nhwc:
+                    del true_node.fluid_code.layers[-1]
-                            if i == 0:
+                    for out_name in output_names:
-                                l = Layer()
+                        out_node = self.graph.get_node(out_name)
-                                l.op = "transpose"
+                        if out_node.layer_type in can_be_optimized_ops:
-                                l.inputs = true_node.fluid_code.layers[
+                            out_node.fluid_code.layers[
-                                    0].inputs["x"]
+                                1].inputs = out_node.fluid_code.layers[0].inputs
-                                l.param_attr = {"perm": [0, 2, 3, 1]}
+                            del out_node.fluid_code.layers[0]
-                                l.output = "nhwc_" + l.inputs.layer_name
+                        elif out_node.layer_type in elementwise_ops:
-                                true_node.fluid_code.layers[0].inputs[
+                            if out_node.inputs[0] in node.layer_name:
-                                    "x"] = l.output
+                                if out_node.fluid_code.layers[
-                                true_node.fluid_code.layers.insert(0, l)
+                                        1].op == 'transpose':
-                            elif i == 1:
+                                    out_node.fluid_code.layers[2].inputs[
-                                l = Layer()
+                                        'x'] = out_node.fluid_code.layers[
-                                l.op = "transpose"
+                                            0].inputs
-                                l.inputs = true_node.fluid_code.layers[
+                                    del out_node.fluid_code.layers[0]
-                                    0].inputs["y"]
+                                else:
-                                l.param_attr = {"perm": [0, 2, 3, 1]}
+                                    out_node.fluid_code.layers[1].inputs[
-                                l.output = "nhwc_" + l.inputs.layer_name
+                                        'x'] = out_node.fluid_code.layers[
-                                true_node.fluid_code.layers[0].inputs[
+                                            0].inputs
-                                    "y"] = l.output
+                                    del out_node.fluid_code.layers[0]
-                                true_node.fluid_code.layers.insert(0, l)
+                            elif out_node.inputs[1] in node.layer_name:
-                            else:
+                                if out_node.fluid_code.layers[
-                                raise Exception("Unexpected situation happend")
+                                        1].op == 'transpose':
+                                    out_node.fluid_code.layers[2].inputs[
+                                        'y'] = out_node.fluid_code.layers[
+                                            1].inputs
+                                    del out_node.fluid_code.layers[1]
+                                else:
+                                    out_node.fluid_code.layers[1].inputs[
+                                        'y'] = out_node.fluid_code.layers[
+                                            0].inputs
+                                    del out_node.fluid_code.layers[0]
+        graph_copy = cp.deepcopy(self.graph)
+        for node_name in self.graph.topo_sort:
+            node = graph_copy.get_node(node_name)
+            if node is None or len(node.fluid_code.layers) < 2:
+                continue
+            if node.layer_type in can_be_optimized_ops and node.layer_type != "Placeholder":
+                if node.fluid_code.layers[
+                        -1].op != "transpose" or node.fluid_code.layers[
+                            -1].param_attr["perm"] != [0, 2, 3, 1]:
                    continue
-                else:
+                can_be_removed = True
-                    for out_name in node.outputs:
+                output_names = node.outputs
+                for out_name in output_names:
+                    out_node = graph_copy.get_node(out_name)
+                    if hasattr(out_node, "can_be_removed"):
+                        if not out_node.can_be_removed:
+                            can_be_removed = False
+                            break
+                    if len(out_node.fluid_code.layers) < 2:
+                        can_be_removed = False
+                        break
+                    if out_node.layer_type in can_be_optimized_ops:
+                        if out_node.fluid_code.layers[
+                                0].op != "transpose" or out_node.fluid_code.layers[
+                                    0].param_attr["perm"] != [0, 3, 1, 2]:
+                            can_be_removed = False
+                            break
+                    elif out_node.layer_type in elementwise_ops:
+                        if out_node.fluid_code.layers[
+                                0].op != "transpose" and out_node.fluid_code.layers[
+                                    1].op != "transpose":
+                            can_be_removed = False
+                            break
+                        if out_node.fluid_code.layers[
+                                0].op == "expand" or out_node.fluid_code.layers[
+                                    1].op == "expand":
+                            can_be_removed = False
+                            break
+                        if out_node.fluid_code.layers[0].op == "transpose":
+                            if out_node.fluid_code.layers[0].param_attr[
+                                    "perm"] != [0, 3, 1, 2]:
+                                can_be_removed = False
+                                break
+                        if out_node.fluid_code.layers[1].op == "transpose":
+                            if out_node.fluid_code.layers[1].param_attr[
+                                    "perm"] != [0, 3, 1, 2]:
+                                can_be_removed = False
+                                break
+                    elif out_node.layer_type not in elementwise_ops and out_node.layer_type not in can_be_optimized_ops:
+                        can_be_removed = False
+                        break
+                if can_be_removed:
+                    true_node = self.graph.get_node(node_name)
+                    if len(true_node.fluid_code.layers) < 2:
+                        continue
+                    true_node.fluid_code.layers[
+                        -2].output = true_node.fluid_code.layers[-1].output
+                    del true_node.fluid_code.layers[-1]
+                    for out_name in output_names:
                        out_node = self.graph.get_node(out_name)
-                        if out_node.layer_type not in elementwise_ops:
+                        if out_node.layer_type in can_be_optimized_ops:
-                            assert out_node.fluid_code.layers[
-                                0].op == "transpose", "unexpected situation happend"
                            out_node.fluid_code.layers[
                                1].inputs = out_node.fluid_code.layers[0].inputs
                            del out_node.fluid_code.layers[0]
+                        elif out_node.layer_type in elementwise_ops:
+                            if out_node.inputs[0] in node.layer_name:
+                                if out_node.fluid_code.layers[
+                                        1].op == 'transpose':
+                                    if out_node.fluid_code.layers[
+                                            2].op == 'transpose':
+                                        out_node.fluid_code.layers[3].inputs[
+                                            'x'] = out_node.fluid_code.layers[
+                                                0].inputs
+                                    else:
+                                        out_node.fluid_code.layers[2].inputs[
+                                            'x'] = out_node.fluid_code.layers[
+                                                0].inputs
+                                    del out_node.fluid_code.layers[0]
+                                else:
+                                    out_node.fluid_code.layers[1].inputs[
+                                        'x'] = out_node.fluid_code.layers[
+                                            0].inputs
+                                    del out_node.fluid_code.layers[0]
+                            elif out_node.inputs[1] in node.layer_name:
+                                if out_node.fluid_code.layers[
+                                        1].op == 'transpose':
+                                    out_node.fluid_code.layers[2].inputs[
+                                        'y'] = out_node.fluid_code.layers[
+                                            1].inputs
+                                    del out_node.fluid_code.layers[1]
+                                else:
+                                    out_node.fluid_code.layers[1].inputs[
+                                        'y'] = out_node.fluid_code.layers[
+                                            0].inputs
+                                    del out_node.fluid_code.layers[0]
+        graph_copy = cp.deepcopy(self.graph)
+        for node_name in self.graph.topo_sort:
+            node = graph_copy.get_node(node_name)
+            if node is None:
+                continue
+            if node.layer_type in elementwise_ops:
+                can_be_removed = True
+                if len(node.fluid_code.layers) < 3:
+                    continue
+                numTranspose = 0
+                numNotTranspose = 0
+                for i in range(len(node.fluid_code.layers)):
+                    if node.fluid_code.layers[i].op == 'transpose':
+                        numTranspose += 1
+                    elif node.fluid_code.layers[i].op != 'expand':
+                        numNotTranspose += 1
+                if numTranspose > numNotTranspose:
+                    if node.fluid_code.layers[0].op == 'expand':
+                        if node.fluid_code.layers[
+                                1].op != 'transpose' or node.fluid_code.layers[
+                                    2].op != 'transpose':
+                            continue
+                        else:
+                            true_node = self.graph.get_node(node_name)
+                            true_node.fluid_code.layers[3].inputs[
+                                'x'] = true_node.fluid_code.layers[1].inputs
+                            true_node.fluid_code.layers[3].inputs[
+                                'y'] = true_node.fluid_code.layers[2].inputs
+                            l = Layer()
+                            l.op = 'transpose'
+                            l.inputs = true_node.fluid_code.layers[3].output
+                            l.param_attr = {'perm': [0, 3, 1, 2]}
+                            if isinstance(l.inputs, six.string_types):
+                                l.output = l.inputs
+                            else:
+                                l.output = l.inputs.layer_name
+                            true_node.fluid_code.layers.append(l)
+                            del true_node.fluid_code.layers[1]
+                            del true_node.fluid_code.layers[1]
+                    else:
+                        if node.fluid_code.layers[
+                                0].op != 'transpose' or node.fluid_code.layers[
+                                    1].op != 'transpose':
+                            continue
+                        else:
+                            true_node = self.graph.get_node(node_name)
+                            true_node.fluid_code.layers[2].inputs[
+                                'x'] = true_node.fluid_code.layers[0].inputs
+                            true_node.fluid_code.layers[2].inputs[
+                                'y'] = true_node.fluid_code.layers[1].inputs
+                            l = Layer()
+                            l.op = 'transpose'
+                            l.inputs = true_node.fluid_code.layers[2].output
+                            l.param_attr = {'perm': [0, 3, 1, 2]}
+                            l.output = l.inputs.layer_name
+                            true_node.fluid_code.layers.append(l)
+                            del true_node.fluid_code.layers[0]
+                            del true_node.fluid_code.layers[0]
    def make_nchw_input_output(self):
        for i, name in enumerate(self.graph.input_nodes):
            node = self.graph.get_node(name)
            if len(node.out_shapes[0]) == 4 and node.tf_data_format == "NHWC":
                shape = node.fluid_code.layers[0].param_attr["shape"]
-                shape = [shape[i] for i in [0, 3, 1, 2]]
+                shape = [shape[j] for j in [0, 3, 1, 2]]
                node.fluid_code.layers[0].param_attr["shape"] = shape
                node.fluid_code.layers[0].output = "nhwc_" + name
                attr = {"perm": [0, 2, 3, 1]}
@@ -353,6 +566,12 @@ class TFOptimizer(object):
                    node.fluid_code.layers[-2].output = name
                    del node.fluid_code.layers[-1]
+    def optimize_sub_graph(self):
+        self.merge_batch_norm()
+        self.merge_prelu()
+        self.merge_scale()
+        self.merge_affine_channel()
    def merge_batch_norm(self):
        for i, name in enumerate(self.graph.topo_sort):
            node = self.graph.get_node(name)
@@ -368,6 +587,10 @@ class TFOptimizer(object):
                    is_batch_norm = False
                    continue
+                if exist_act(in_nodes0[0]) or exist_act(in_nodes0[1]):
+                    is_batch_norm = False
+                    continue
                in_nodes1 = [
                    self.graph.get_node(in_name)
                    for in_name in in_nodes0[0].inputs
@@ -382,11 +605,17 @@ class TFOptimizer(object):
                if in_nodes1[1].layer_type != "Mul":
                    is_batch_norm = False
                    continue
+                if exist_act(in_nodes1[1]):
+                    is_batch_norm = False
+                    continue
                if in_nodes2[0].layer_type != "Const" or in_nodes2[
                        1].layer_type != "Mul":
                    is_batch_norm = False
                    continue
+                if exist_act(in_nodes2[1]):
+                    is_batch_norm = False
+                    continue
                in_nodes3 = [
                    self.graph.get_node(in_name)
@@ -410,6 +639,9 @@ class TFOptimizer(object):
                if in_nodes5.layer_type != "Add":
                    is_batch_norm = False
                    continue
+                if exist_act(in_nodes5):
+                    is_batch_norm = False
+                    continue
                in_nodes6 = [
                    self.graph.get_node(in_name) for in_name in in_nodes5.inputs
@@ -485,10 +717,9 @@ class TFOptimizer(object):
                if is_batch_norm:
                    index = in_nodes1[0].outputs.index(in_nodes0[0].layer_name)
-                    del in_nodes1[0].outputs[index]
+                    in_nodes1[0].outputs[index] = node.layer_name
                    node.layer_type = "FusedBatchNorm"
                    node.inputs = [in_nodes1[0].layer_name]
-                    node.outputs = node.outputs
                    act = node.fluid_code.layers[-1].param_attr.get("act", None)
                    node.fluid_code.clear()
                    attr = {
@@ -522,6 +753,9 @@ class TFOptimizer(object):
                continue
            is_prelu = True
            if node.layer_type == "Add":
+                if exist_act(node):
+                    is_prelu = False
+                    continue
                in_nodes0 = [
                    self.graph.get_node(in_name) for in_name in node.inputs
                ]
@@ -529,6 +763,10 @@ class TFOptimizer(object):
                        1].layer_type != "Mul":
                    is_prelu = False
                    continue
+                if exist_act(in_nodes0[1]):
+                    is_prelu = False
+                    continue
                if len(in_nodes0[0].outputs) != 1 or len(
                        in_nodes0[1].outputs) != 1:
                    is_prelu = False
@@ -546,6 +784,9 @@ class TFOptimizer(object):
                if in_nodes2[0].layer_type != "Mul":
                    is_prelu = False
                    continue
+                if exist_act(in_nodes2[0]):
+                    is_prelu = False
+                    continue
                if len(in_nodes2[1].outputs) != 1 or len(
                        in_nodes2[0].outputs) != 1:
                    is_prelu = False
@@ -559,6 +800,9 @@ class TFOptimizer(object):
                        1].layer_type != "Sub":
                    is_prelu = False
                    continue
+                if exist_act(in_nodes3[1]):
+                    is_prelu = False
+                    continue
                if len(in_nodes3[0].outputs) != 1 or len(
                        in_nodes3[1].outputs) != 1:
                    is_prelu = False
@@ -638,10 +882,10 @@ class TFOptimizer(object):
                    del in_nodes1.outputs[index]
                    index = in_nodes1.outputs.index(in_nodes4[1].layer_name)
                    del in_nodes1.outputs[index]
+                    in_nodes1.outputs.append(node.layer_name)
                    node.layer_type = "Prelu"
                    node.inputs = [in_nodes1.layer_name]
-                    node.outputs = node.outputs
                    act = node.fluid_code.layers[-1].param_attr.get("act", None)
                    node.fluid_code.clear()
                    attr = {
@@ -660,3 +904,181 @@ class TFOptimizer(object):
                del self.graph.node_map[in_nodes2[1].layer_name]
                del self.graph.node_map[in_nodes3[1].layer_name]
                del self.graph.node_map[in_nodes4[1].layer_name]
+    def merge_scale(self):
+        for i, name in enumerate(self.graph.topo_sort):
+            node = self.graph.get_node(name)
+            if node is None:
+                continue
+            is_scale = True
+            if node.layer_type == "Sub":
+                in_nodes0 = [
+                    self.graph.get_node(in_name) for in_name in node.inputs
+                ]
+                if in_nodes0[0].layer_type != "Mul" or in_nodes0[
+                        1].layer_type != "Const" or in_nodes0[1].value.size != 1:
+                    is_scale = False
+                    continue
+                if exist_act(in_nodes0[0]):
+                    is_scale = False
+                    continue
+                if len(in_nodes0[0].outputs) != 1 or len(
+                        in_nodes0[1].outputs) != 1:
+                    is_scale = False
+                    continue
+                in_nodes1 = [
+                    self.graph.get_node(in_name)
+                    for in_name in in_nodes0[0].inputs
+                ]
+                if in_nodes1[0].layer_type != "Const" or in_nodes1[
+                        1].layer_type != "RealDiv" or in_nodes1[
+                            0].value.size != 1:
+                    is_scale = False
+                    continue
+                if exist_act(in_nodes1[1]):
+                    is_scale = False
+                    continue
+                if len(in_nodes1[0].outputs) != 1 or len(
+                        in_nodes1[1].outputs) != 1:
+                    is_scale = False
+                    continue
+                in_nodes2 = [
+                    self.graph.get_node(in_name)
+                    for in_name in in_nodes1[1].inputs
+                ]
+                if in_nodes2[1].layer_type != "Const" or in_nodes2[
+                        1].value.size != 1:
+                    is_scale = False
+                    continue
+                if is_scale:
+                    in_node = self.graph.get_node(in_nodes1[1].inputs[0])
+                    index = in_node.outputs.index(in_nodes1[1].layer_name)
+                    in_node.outputs[index] = node.layer_name
+                    node.layer_type = "Scale"
+                    node.inputs = [in_node.layer_name]
+                    scale = 1.0 / in_nodes2[1].value * in_nodes1[0].value
+                    act = None
+                    if node.fluid_code.layers[0].param_attr is not None:
+                        act = node.fluid_code.layers[0].param_attr.get(
+                            "act", None)
+                    node.fluid_code.clear()
+                    attr = {
+                        "scale": scale,
+                        "bias": in_nodes0[1].value,
+                        "bias_after_scale": True,
+                        "act": act
+                    }
+                    node.fluid_code.add_layer("scale",
+                                              inputs=in_node,
+                                              output=node,
+                                              param_attr=attr)
+                    del self.graph.node_map[in_nodes0[0].layer_name]
+                    del self.graph.node_map[in_nodes0[1].layer_name]
+                    del self.graph.node_map[in_nodes1[0].layer_name]
+                    del self.graph.node_map[in_nodes1[1].layer_name]
+                    del self.graph.node_map[in_nodes2[1].layer_name]
+    def merge_affine_channel(self):
+        for i, name in enumerate(self.graph.topo_sort):
+            node = self.graph.get_node(name)
+            if node is None:
+                continue
+            is_affine_channel = True
+            if node.layer_type == "RealDiv":
+                in_nodes0 = [
+                    self.graph.get_node(in_name) for in_name in node.inputs
+                ]
+                bias_add = True
+                if (in_nodes0[0].layer_type != "Sub" and in_nodes0[0].layer_type
+                        != "Add") or in_nodes0[1].layer_type != "Const" or len(
+                            in_nodes0[1].value.shape) != 3:
+                    is_affine_channel = False
+                    continue
+                if in_nodes0[0].layer_type == "Sub":
+                    bias_add = False
+                if exist_act(in_nodes0[0]):
+                    is_affine_channel = False
+                    continue
+                if len(in_nodes0[0].outputs) != 1 or len(
+                        in_nodes0[1].outputs) != 1:
+                    is_affine_channel = False
+                    continue
+                in_nodes1 = [
+                    self.graph.get_node(in_name)
+                    for in_name in in_nodes0[0].inputs
+                ]
+                if len(in_nodes1[0].out_shapes[0]
+                       ) != 4 or in_nodes1[1].layer_type != "Const" or len(
+                           in_nodes1[1].value.shape) != 3:
+                    is_affine_channel = False
+                    continue
+                if len(in_nodes1[1].outputs) != 1:
+                    is_affine_channel = False
+                    continue
+                channel = in_nodes1[0].out_shapes[0][-1]
+                if channel < 0 or channel != in_nodes0[
+                        1].value.size or channel != in_nodes1[1].value.size:
+                    is_affine_channel = False
+                    continue
+                if in_nodes0[1].out_shapes[0][-1] != in_nodes0[
+                        1].value.size or in_nodes1[1].out_shapes[0][
+                            -1] != in_nodes1[1].value.size:
+                    is_affine_channel = False
+                    continue
+                if is_affine_channel:
+                    in_node = in_nodes1[0]
+                    index = in_node.outputs.index(in_nodes0[0].layer_name)
+                    in_node.outputs[index] = node.layer_name
+                    node.layer_type = "AffineChannel"
+                    node.inputs = [in_node.layer_name]
+                    scale = 1.0 / in_nodes0[1].value.flatten()
+                    bias = in_nodes1[1].value.flatten(
+                    ) / in_nodes0[1].value.flatten()
+                    if not bias_add:
+                        bias *= -1.0
+                    self.op_mapper.weights[node.layer_name + "_scale"] = scale
+                    self.op_mapper.weights[node.layer_name + "_bias"] = bias
+                    act = None
+                    if node.fluid_code.layers[0].param_attr is not None:
+                        act = node.fluid_code.layers[0].param_attr.get(
+                            "act", None)
+                    node.fluid_code.clear()
+                    attr = {
+                        "dtype": string(scale.dtype),
+                        "shape": [channel],
+                        "name": string(node.layer_name + "_scale")
+                    }
+                    node.fluid_code.add_layer("create_parameter",
+                                              inputs=None,
+                                              output=node.layer_name + "_scale",
+                                              param_attr=attr)
+                    attr = {
+                        "dtype": string(scale.dtype),
+                        "shape": [channel],
+                        "name": string(node.layer_name + "_bias")
+                    }
+                    node.fluid_code.add_layer("create_parameter",
+                                              inputs=None,
+                                              output=node.layer_name + "_bias",
+                                              param_attr=attr)
+                    inputs = {
+                        "x": in_node,
+                        "scale": node.layer_name + "_scale",
+                        "bias": node.layer_name + "_bias"
+                    }
+                    attr = {"act": act}
+                    node.fluid_code.add_layer("affine_channel",
+                                              inputs=inputs,
+                                              output=node,
+                                              param_attr=attr)
+                    del self.graph.node_map[in_nodes0[0].layer_name]
+                    del self.graph.node_map[in_nodes0[1].layer_name]
+                    del self.graph.node_map[in_nodes1[1].layer_name]
--- a/x2paddle_model_zoo.md
+++ b/x2paddle_model_zoo.md
@@ -65,3 +65,4 @@
 | mNASNet | [pytorch(personal practice)](https://github.com/rwightman/gen-efficientnet-pytorch) |9|
 | EfficientNet | [pytorch(personal practice)](https://github.com/rwightman/gen-efficientnet-pytorch) |9|
 | SqueezeNet | [onnx official](https://s3.amazonaws.com/download.onnx/models/opset_9/squeezenet.tar.gz) |9|
+|Ultra-Light-Fast-Generic-Face-Detector-1MB| [onnx_model](https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB/tree/master/models/onnx)| |