Merge pull request #41 from SunAhong1993/develop

add caffe emitter for alexnet

Merge pull request #41 from SunAhong1993/develop
add caffe emitter for alexnet
9e3ab110 · Jason · GitHub · 865cef02 · efce5514 · 9e3ab110
5 changed file
--- a/x2paddle/convert.py
+++ b/x2paddle/convert.py
@@ -11,9 +11,7 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-from x2paddle.parser.tf_parser import TFParser
-from x2paddle.optimizer.tf_optimizer import TFGraphOptimizer
-from x2paddle.emitter.tf_emitter import TFEmitter
 from six import text_type as _text_type
 import argparse
@@ -50,6 +48,9 @@ def arg_parser():
 def tf2paddle(model, save_dir):
    print("Now translating model from tensorflow to paddle.")
+    from x2paddle.parser.tf_parser import TFParser
+    from x2paddle.optimizer.tf_optimizer import TFGraphOptimizer
+    from x2paddle.emitter.tf_emitter import TFEmitter
    parser = TFParser(model)
    emitter = TFEmitter(parser)
    emitter.run()
@@ -57,7 +58,13 @@ def tf2paddle(model, save_dir):
 def caffe2paddle(proto, weight, save_dir):
-    print("Not implement yet.")
+    print("Now translating model from caffe to paddle.")
+    from x2paddle.parser.caffe_parser import CaffeParser
+    from x2paddle.emitter.caffe_emitter import CaffeEmitter
+    parser = CaffeParser(proto, weight)
+    emitter = CaffeEmitter(parser)
+    emitter.run()
+    emitter.save_python_model(save_dir)
 def main():

--- a/x2paddle/core/util.py
+++ b/x2paddle/core/util.py
@@ -45,6 +45,8 @@ def export_paddle_param(param, param_name, dir):
        assert param.size == 1, "Unexpected situation happend!"
        shape = [1]
    assert str(param.dtype) in dtype_map, "Unknown dtype of params."
+    if not os.path.exists(dir):
+        os.makedirs(dir)
    fp = open(os.path.join(dir, param_name), 'wb')
    fp.write(struct.pack('i', 0))

--- a/x2paddle/emitter/caffe_emitter.py
+++ b/x2paddle/emitter/caffe_emitter.py
@@ -11,3 +11,336 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import numbers
+from x2paddle.parser.caffe_parser import CaffeGraph
+from x2paddle.core.emitter import Emitter
+from x2paddle.core.util import *
+class CaffeEmitter(Emitter):
+    def __init__(self, parser):
+        super(CaffeEmitter, self).__init__()
+        self.parser = parser
+        self.graph = parser.caffe_graph
+        self.weights = dict()
+        resolver = parser.resolver
+        if resolver.has_pycaffe():
+            self.did_use_pb = False
+        else:
+            self.did_use_pb = True
+    def run(self):
+        print("Total nodes: {}".format(len(self.graph.topo_sort)))
+        for node_name in self.graph.topo_sort:
+            node = self.graph.get_node(node_name)
+            op = node.layer_type
+            if hasattr(self, op):
+                emit_func = getattr(self, op)
+                emit_func(node)
+        for i in range(len(self.graph.topo_sort)):
+            node_name = self.graph.topo_sort[i]
+            node = self.graph.get_node(node_name)
+            self.net_code += node.fluid_code.gen_codes()
+    def adjust_parameters(self, node, data):
+        if not self.did_use_pb:
+            return data
+        # When using the protobuf-backend, each parameter initially has four dimensions.
+        # In certain cases (like FC layers), we want to eliminate the singleton dimensions.
+        # This implementation takes care of the common cases. However, it does leave the
+        # potential for future issues.
+        # The Caffe-backend does not suffer from this problem.
+        data = list(data)
+        squeeze_indices = [1]  # Squeeze biases.
+        if node.kind == NodeKind.InnerProduct:
+            squeeze_indices.append(0)  # Squeeze FC.
+        for idx in squeeze_indices:
+            if idx >= len(data):
+                continue
+            d = data[idx]
+            assert len(
+                d.shape
+            ) == 4, 'invalid shape[%s] from caffe when adjust_parameters' % (
+                str(d.shape))
+            shape_old = d.shape
+            sq_axis = None
+            if idx == 0:
+                sq_axis = (0, 1)
+            elif idx == 1:
+                sq_axis = (0, 1, 2)
+            else:
+                continue
+            data[idx] = np.squeeze(d, axis=sq_axis)
+            shape_new = data[idx].shape
+            if len(shape_old) != shape_new:
+                debug('squeeze idx:%d, with kind:%s,name:%s' % \
+                        (idx, node.kind, node.name))
+        return data
+    @staticmethod
+    def get_kernel_value(scalar, repeated, idx, default=None):
+        if scalar:
+            return scalar
+        if repeated:
+            if isinstance(repeated, numbers.Number):
+                return repeated
+            if len(repeated) == 1:
+                # Same value applies to all spatial dimensions
+                return int(repeated[0])
+            assert idx < len(repeated)
+            # Extract the value for the given spatial dimension
+            return repeated[idx]
+        if default is None:
+            raise ValueError('Unable to determine kernel parameter!')
+        return default
+    def get_kernel_parameters(self, kind, params):
+        assert kind in ['Convolution', 'Pooling', 'Deconvolution']
+        k_h = self.get_kernel_value(params.kernel_h, params.kernel_size, 0)
+        k_w = self.get_kernel_value(params.kernel_w, params.kernel_size, 1)
+        s_h = self.get_kernel_value(params.stride_h,
+                                    params.stride,
+                                    0,
+                                    default=1)
+        s_w = self.get_kernel_value(params.stride_w,
+                                    params.stride,
+                                    1,
+                                    default=1)
+        p_h = self.get_kernel_value(params.pad_h, params.pad, 0, default=0)
+        p_w = self.get_kernel_value(params.pad_w, params.pad, 1, default=0)
+        dila_h = dila_w = 1
+        group = 1
+        c_o = 1
+        if kind in ['Convolution', 'Deconvolution']:
+            c_o = params.num_output
+            group = params.group
+            dila_len = len(params.dilation)
+            if dila_len == 2:
+                dila_h = params.dilation[0]
+                dila_w = params.dilation[1]
+            elif dila_len == 1:
+                dila_h = dila_w = params.dilation[0]
+            else:
+                assert dila_len == 0, "invalid length[%s] of dilation in convolution" % (
+                    dila_len)
+        kernel = [k_h, k_w]
+        stride = [s_h, s_w]
+        pad = [p_h, p_w]
+        dilation = [dila_h, dila_w]
+        return c_o, kernel, stride, pad, dilation, group
+    def Input(self, node):
+        shape = list(node.layer.input_param.shape[0].dim)[1:]
+        dtype = 'float32'
+        attr = {
+            'dtype': string(dtype),
+            'shape': shape,
+            'name': string(node.layer_name)
+        }
+        node.fluid_code.add_layer("data",
+                                  inputs=None,
+                                  output=node,
+                                  param_attr=attr)
+    def Convolution(self, node):
+        data = node.data
+        data = self.adjust_parameters(node, data)
+        self.weights[node.layer_name + '_weights'] = data[0]
+        if len(data) == 2:
+            self.weights[node.layer_name + '_bias'] = data[1]
+        params = node.layer.convolution_param
+        channel, kernel, stride, pad, dilation, group = self.get_kernel_parameters(
+            node.layer_type, params)
+        assert len(node.inputs
+                   ) == 1, 'The count of Convolution node\'s input is not 1.'
+        input = self.graph.get_bottom_node(node, idx=0, copy=True)
+        attr = {
+            'filter_size': kernel,
+            'num_filters': channel,
+            'stride': stride,
+            'padding': pad,
+            'dilation': dilation,
+            'groups': group,
+            'name': string(node.layer_name),
+            'param_attr': string(node.layer_name + '_weights'),
+            'bias_attr': string(node.layer_name + '_bias'),
+        }
+        node.fluid_code.add_layer("conv2d",
+                                  inputs=input,
+                                  output=node,
+                                  param_attr=attr)
+    def Deconvolution(self, node):
+        data = node.data
+        data = self.adjust_parameters(node, data)
+        self.weights[node.layer_name + '_weights'] = data[0]
+        if len(data) == 2:
+            self.weights[node.layer_name + '_bias'] = data[1]
+        params = node.layer.convolution_param
+        channel, kernel, stride, pad, dilation, group = self.get_kernel_parameters(
+            node.layer_type, params)
+        assert len(node.inputs
+                   ) == 1, 'The count of Deconvolution node\'s input is not 1.'
+        input = self.graph.get_bottom_node(node, idx=0, copy=True)
+        attr = {
+            'output_size': None,
+            'filter_size': kernel,
+            'num_filters': channel,
+            'stride': stride,
+            'padding': pad,
+            'dilation': dilation,
+            'groups': group,
+            'name': string(node.layer_name),
+            'param_attr': string(node.layer_name + '_weights'),
+            'bias_attr': string(node.layer_name + '_bias')
+        }
+        node.fluid_code.add_layer("conv2d_transpose",
+                                  inputs=input,
+                                  output=node,
+                                  param_attr=attr)
+    def Pooling(self, node):
+        params = node.layer.pooling_param
+        channel, kernel, stride, pad, dilation, group = self.get_kernel_parameters(
+            node.layer_type, params)
+        if params.pool == 0:
+            pool_type = 'max'
+        else:
+            pool_type = 'avg'
+        assert len(
+            node.inputs) == 1, 'The count of Pooling node\'s input is not 1.'
+        input = self.graph.get_bottom_node(node, idx=0, copy=True)
+        attr = {
+            'pool_size': kernel,
+            'pool_stride': stride,
+            'pool_padding': pad,
+            'ceil_mode': True,
+            'pool_type': string(pool_type),
+            'exclusive': True,
+            'name': string(node.layer_name)
+        }
+        node.fluid_code.add_layer("pool2d",
+                                  inputs=input,
+                                  output=node,
+                                  param_attr=attr)
+    def ReLU(self, node):
+        assert len(
+            node.inputs) == 1, 'The count of ReLU node\'s input is not 1.'
+        input = self.graph.get_bottom_node(node, idx=0, copy=True)
+        attr = {'name': string(node.layer_name)}
+        node.fluid_code.add_layer("relu",
+                                  inputs=input,
+                                  output=node,
+                                  param_attr=attr)
+    def LRN(self, node):
+        assert len(node.inputs) == 1, 'The count of LRN node\'s input is not 1.'
+        params = node.layer.lrn_param
+        # The window size must be an odd value. For a window
+        # size of (2*n+1), Paddle defines depth_radius = n.
+        assert params.local_size % 2 == 1
+        # Caffe scales by (alpha/(2*n+1)), whereas Paddle
+        # just scales by alpha (as does Krizhevsky's paper).
+        # We'll account for that here.
+        alpha = params.alpha / float(params.local_size)
+        input = self.graph.get_bottom_node(node, idx=0, copy=True)
+        attr = {
+            'n': params.local_size,
+            'k': 1.0,
+            'alpha': alpha,
+            'beta': params.beta,
+            'name': string(node.layer_name)
+        }
+        node.fluid_code.add_layer("lrn",
+                                  inputs=input,
+                                  output=node,
+                                  param_attr=attr)
+    def InnerProduct(self, node):
+        data = node.data
+        data = self.adjust_parameters(node, data)
+        # Reshape the parameters to Paddle's ordering
+        transpose_order = (1, 0)
+        w = data[0]
+        fc_shape = w.shape
+        output_channels = fc_shape[0]
+        w = w.reshape((output_channels, -1))
+        w = w.transpose(transpose_order)
+        data[0] = w
+        self.weights[node.layer_name + '_weights'] = data[0]
+        if len(data) == 2:
+            self.weights[node.layer_name + '_bias'] = data[1]
+        assert len(node.inputs
+                   ) == 1, 'The count of InnerProduct node\'s input is not 1.'
+        params = node.layer.inner_product_param
+        assert params.axis == 1
+        assert params.bias_term == True
+        input = self.graph.get_bottom_node(node, idx=0, copy=True)
+        attr = {
+            'size': params.num_output,
+            'name': string(node.layer_name),
+            'act': None,
+            'param_attr': string(node.layer_name + '_weights'),
+            'bias_attr': string(node.layer_name + '_bias')
+        }
+        node.fluid_code.add_layer("fc",
+                                  inputs=input,
+                                  output=node,
+                                  param_attr=attr)
+    def Softmax(self, node):
+        assert len(
+            node.inputs) == 1, 'The count of Softmax node\'s input is not 1.'
+        input = self.graph.get_bottom_node(node, idx=0, copy=True)
+        params = node.layer.softmax_param
+        axis = params.axis
+        shape = node.input_shape[0]
+        dims = len(shape)
+        axis = axis + dims if axis < 0 else axis
+        need_transpose = False
+        if axis + 1 != dims:
+            need_transpose = True
+        if need_transpose:
+            in_order = list(range(dims))
+            in_order.remove(axis)
+            in_order.append(axis)
+            attr = {
+                'perm': in_order,
+                'name': string(node.layer_name + '_transpose_in')
+            }
+            node.fluid_code.add_layer("transpose",
+                                      inputs=input,
+                                      output=node,
+                                      param_attr=attr)
+        attr = {'name': string(node.layer_name + '_softmax')}
+        node.fluid_code.add_layer("softmax",
+                                  inputs=node if need_transpose else input,
+                                  output=node,
+                                  param_attr=attr)
+        if need_transpose:
+            out_order = [
+                0,
+            ] * dims
+            for id, v in enumerate(in_order):
+                out_order[v] = id
+            attr = {
+                'perm': out_order,
+                'name': string(node.layer_name + '_transpose_out')
+            }
+            node.fluid_code.add_layer("transpose",
+                                      inputs=node,
+                                      output=node,
+                                      param_attr=attr)
--- a/x2paddle/parser/caffe_parser.py
+++ b/x2paddle/parser/caffe_parser.py
@@ -17,6 +17,8 @@ import sys
 from google.protobuf import text_format
 import numpy as np
 from x2paddle.core.graph import GraphNode, Graph
+from x2paddle.core.fluid_code import FluidCode
+from x2paddle.parser import caffe_shape
 class CaffeResolver(object):
@@ -62,10 +64,19 @@ class CaffeGraphNode(GraphNode):
        else:
            super(CaffeGraphNode, self).__init__(layer, layer_name)
        self.layer_type = layer.type
+        self.fluid_code = FluidCode()
    def set_params(self, params):
        self.data = params
+    def set_output_shape(self, input_shape):
+        func_name = 'shape_' + self.layer_type.lower()
+        self.output_shape = getattr(caffe_shape, func_name)(self.layer,
+                                                            input_shape)
+    def set_input_shape(self, input_shape):
+        self.input_shape = input_shape
 class CaffeGraph(Graph):
    def __init__(self, model, params):
@@ -148,8 +159,34 @@ class CaffeGraph(Graph):
            else:
                notice('Ignoring parameters for non-existent layer: %s' % \
                        layer_name)
+        for layer_name in self.node_map:
+            node = self.node_map[layer_name]
+            inputs = node.inputs
+            i = 0
+            input_shape = []
+            for nm in inputs:
+                last_node = self.get_node(nm)
+                tmp = node.layer.bottom[i]
+                i = i + 1
+                idx = list(last_node.layer.top).index(tmp)
+                input_shape.append(last_node.output_shape[idx])
+            node.set_output_shape(input_shape)
+            node.set_input_shape(input_shape)
        super(CaffeGraph, self).build()
+    def get_bottom_node(self, node, idx=0, copy=False):
+        input_node_name = node.inputs[idx]
+        assert input_node_name in self.node_map, 'The {} isn\'t a valid node'.format(
+            name)
+        input_node = self.node_map[input_node_name]
+        if len(input_node.layer.top) > 1:
+            idx = list(input_node.layer.top).index(node.layer.bottom[need])
+            name = input_node_name + ':' + str(idx)
+        else:
+            name = input_node_name
+        return self.get_node(name, copy=copy)
 class CaffeParser(object):
    def __init__(self, proto_path, model_path, use_caffe=True):
@@ -175,6 +212,8 @@ class CaffeParser(object):
    def load_using_caffe(self):
        caffe = self.resolver.caffe
        caffe.set_mode_cpu()
+        print(self.proto_path)
+        print(self.model_path)
        net = caffe.Net(self.proto_path, self.model_path, caffe.TEST)
        data = lambda blob: blob.data
        self.params = [(k, list(map(data, v))) for k, v in net.params.items()]

--- a/x2paddle/parser/caffe_shape.py
+++ b/x2paddle/parser/caffe_shape.py
+#   Copyright (c) 2019  PaddlePaddle Authors. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License"
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import math
+def get_params_w_h(params):
+    if hasattr(params, 'dilation'):
+        if len(params.dilation) == 0:
+            dila_h = 1
+            dila_w = 1
+        elif len(params.dilation) == 1:
+            dila_h = params.dilation[0]
+            dila_w = params.dilation[0]
+        else:
+            dila_h = params.dilation[0]
+            dila_w = params.dilation[1]
+    else:
+        dila_h = 1
+        dila_w = 1
+    if not isinstance(getattr(params, 'pad'), int):
+        if len(params.pad) == 0:
+            pad_h = 1
+            pad_w = 1
+        elif len(params.pad) == 1:
+            pad_h = params.pad[0]
+            pad_w = params.pad[0]
+        else:
+            pad_h, pad_w, = params.pad[0]
+            pad_w = params.pad[1]
+        if params.pad_h != 0 or params.pad_w != 0:
+            pad_h = params.pad_h
+            pad_w = params.pad_w
+    else:
+        if params.pad_h != 0 or params.pad_w != 0:
+            pad_h = params.pad_h
+            pad_w = params.pad_w
+        else:
+            pad_h = getattr(params, 'pad')
+            pad_w = getattr(params, 'pad')
+    if not isinstance(getattr(params, 'kernel_size'), int):
+        if len(params.kernel_size) == 0:
+            kernel_h = 1
+            kernel_w = 1
+        elif len(params.kernel_size) == 1:
+            kernel_h = params.kernel_size[0]
+            kernel_w = params.kernel_size[0]
+        else:
+            kernel_h = params.kernel_size[0]
+            kernel_w = params.kernel_size[1]
+        if params.kernel_h != 0 or params.kernel_w != 0:
+            kernel_h = params.kernel_h
+            kernel_w = params.kernel_w
+    else:
+        if params.kernel_h != 0 or params.kernel_w != 0:
+            kernel_h = params.kernel_h
+            kernel_w = params.kernel_w
+        else:
+            kernel_h = getattr(params, 'kernel_size')
+            kernel_w = getattr(params, 'kernel_size')
+    if not isinstance(getattr(params, 'stride'), int):
+        if len(params.stride) == 0:
+            stride_h = 1
+            stride_w = 1
+        elif len(params.stride) == 1:
+            stride_h = params.stride[0]
+            stride_w = params.stride[0]
+        else:
+            stride_h = params.stride[0]
+            stride_w = params.stride[1]
+        if params.stride_h != 0 or params.stride_w != 0:
+            stride_h = params.stride_h
+            stride_w = params.stride_w
+    else:
+        if params.stride_h != 0 or params.stride_w != 0:
+            stride_h = params.stride_h
+            stride_w = params.stride_w
+        else:
+            stride_h = getattr(params, 'stride')
+            stride_w = getattr(params, 'stride')
+    return dila_h, dila_w, pad_h, pad_w, kernel_h, kernel_w, stride_h, stride_w
+def get_filter_output_shape(i_h, i_w, params, round_func):
+    dila_h, dila_w, pad_h, pad_w, kernel_h, kernel_w, stride_h, stride_w = get_params_w_h(
+        params)
+    o_h = (i_h + 2 * pad_h - (dila_h *
+                              (kernel_h - 1) + 1)) / float(stride_h) + 1
+    o_w = (i_w + 2 * pad_w - (dila_w *
+                              (kernel_w - 1) + 1)) / float(stride_w) + 1
+    return (int(round_func(o_h)), int(round_func(o_w)))
+def get_strided_kernel_output_shape(params, input_shape, round_func):
+    o_h, o_w = get_filter_output_shape(input_shape[2], input_shape[3], params,
+                                       round_func)
+    has_c_o = hasattr(params, 'num_output')
+    c = params.num_output if has_c_o else input_shape[1]
+    return [[input_shape[0], c, o_h, o_w]]
+def shape_convolution(layer, input_shape):
+    params = layer.convolution_param
+    return get_strided_kernel_output_shape(params, input_shape[0], math.floor)
+def shape_deconvolution(layer, input_shape):
+    h_i = input_shape[2]
+    w_i = input_shape[3]
+    params = layer.convolution_param
+    dila_h, dila_w, pad_h, pad_w, kernel_h, kernel_w, stride_h, stride_w = get_params_w_h(
+        params)
+    h_o = (h_i - 1) * stride_h - 2 * pad_h + dila_h * (kernel_h - 1) + 1
+    w_o = (w_i - 1) * stride_w - 2 * pad_w + dila_w * (kernel_w - 1) + 1
+    has_c_o = hasattr(params, 'num_output')
+    c = params.num_output if has_c_o else input_shape.channels
+    return [[input_shape[0][0], c, h_o, w_o]]
+def shape_pooling(layer, input_shape):
+    params = layer.pooling_param
+    global_pool = getattr(params, 'global_pooling', False)
+    if global_pool:
+        return [[input_shape[0][0], input_shape[0][1], 1, 1]]
+    ceil_mode = getattr(params, 'ceil_mode', True)
+    if ceil_mode is True:
+        method = math.ceil
+    else:
+        method = math.floor
+    return get_strided_kernel_output_shape(params, input_shape[0], method)
+def shape_innerproduct(layer, input_shape):
+    params = layer.inner_product_param
+    return [[input_shape[0][0], params.num_output]]
+def shape_lrn(layer, input_shape):
+    return input_shape
+def shape_relu(layer, input_shape):
+    return input_shape
+def shape_softmax(layer, input_shape):
+    return input_shape
+def shape_input(layer, input_shape):
+    return [list(layer.input_param.shape[0].dim)]