change src dir to tf2fluid

c5b22aca · jiangjiajun · e4babb02 · e4babb02 · c5b22aca · c5b22aca
10 changed file
--- a/requirements.txt
+++ b/requirements.txt
-paddlepaddle
-tensorflow
-flake8
--- a/tensorflow2fluid/src/__init__.py
+++ b/tensorflow2fluid/src/__init__.py
--- a/tensorflow2fluid/src/convert.py
+++ b/tensorflow2fluid/src/convert.py
@@ -18,33 +18,74 @@ from tensorflow_parser import TensorflowPbParser
 from six import text_type as _text_type
 from utils import *
 import argparse
-import logging 
+import logging
 import os
 logging.basicConfig(level=logging.DEBUG)

+
 def _get_parser():
    parser = argparse.ArgumentParser()
-    parser.add_argument("--meta_file", "-m", type=_text_type, 
-        default=None, help="meta file path for checkpoint format")
-    parser.add_argument("--ckpt_dir", "-c", type=_text_type, 
-        default=None, help="checkpoint directory")
-    parser.add_argument("--pb_file", "-p", type=_text_type, 
-        default=None, help="pb model file path")
-    parser.add_argument("--in_nodes", "-i", type=_text_type, nargs="+", 
-        default=None, help="input nodes name")
-    parser.add_argument("--input_shape", "-is", type=_text_type, nargs="+", 
-        default=None, help="input tensor shape")
-    parser.add_argument("--output_nodes", "-o", type=_text_type, nargs="+", 
-        default=None, help="output nodes name")
-    parser.add_argument("--save_dir", "-s", type=_text_type, 
-        default=None, help="path to save transformed paddle model")
-    parser.add_argument("--input_format", "-sf", type=_text_type, 
-        default=None, help="input data format(NHWC/NCHW or OTHER)")
-    parser.add_argument("--use_cuda", "-u", type=_text_type, 
-        default="True", help="True for use gpu")
+    parser.add_argument(
+        "--meta_file",
+        "-m",
+        type=_text_type,
+        default=None,
+        help="meta file path for checkpoint format")
+    parser.add_argument(
+        "--ckpt_dir",
+        "-c",
+        type=_text_type,
+        default=None,
+        help="checkpoint directory")
+    parser.add_argument(
+        "--pb_file",
+        "-p",
+        type=_text_type,
+        default=None,
+        help="pb model file path")
+    parser.add_argument(
+        "--in_nodes",
+        "-i",
+        type=_text_type,
+        nargs="+",
+        default=None,
+        help="input nodes name")
+    parser.add_argument(
+        "--input_shape",
+        "-is",
+        type=_text_type,
+        nargs="+",
+        default=None,
+        help="input tensor shape")
+    parser.add_argument(
+        "--output_nodes",
+        "-o",
+        type=_text_type,
+        nargs="+",
+        default=None,
+        help="output nodes name")
+    parser.add_argument(
+        "--save_dir",
+        "-s",
+        type=_text_type,
+        default=None,
+        help="path to save transformed paddle model")
+    parser.add_argument(
+        "--input_format",
+        "-sf",
+        type=_text_type,
+        default=None,
+        help="input data format(NHWC/NCHW or OTHER)")
+    parser.add_argument(
+        "--use_cuda",
+        "-u",
+        type=_text_type,
+        default="True",
+        help="True for use gpu")
    return parser

-def _convert(args):
+
+def run(args):
    if args.meta_file is None and args.pb_file is None:
        raise Exception("Need to define --meta_file or --pb_file")
    if args.input_format is None:
@@ -78,27 +119,30 @@ def _convert(args):
                items[i] = int(items[i])
            else:
                items[i] = None
-                
+
        input_shape.append(items)

    logging.info("Loading tensorflow model...")
    if args.meta_file is not None:
-        parser = TensorflowCkptParser(args.meta_file, args.ckpt_dir, 
-            args.output_nodes, input_shape, args.in_nodes, input_format)
+        parser = TensorflowCkptParser(args.meta_file, args.ckpt_dir,
+                                      args.output_nodes, input_shape,
+                                      args.in_nodes, input_format)
    else:
-        parser = TensorflowPbParser(args.pb_file, args.output_nodes, 
-            input_shape, args.in_nodes, input_format)
+        parser = TensorflowPbParser(args.pb_file, args.output_nodes,
+                                    input_shape, args.in_nodes, input_format)
    logging.info("Tensorflow model loaded!")

    emitter = PaddleEmitter(parser, args.save_dir)
    emitter.run()

-    open(args.save_dir+"/__init__.py", "w").close()
+    open(args.save_dir + "/__init__.py", "w").close()
+

 def _main():
    parser = _get_parser()
    args = parser.parse_args()
-    _convert(args)
+    run(args)
+

 if __name__ == "__main__":
    _main()
--- a/tensorflow2fluid/src/framework_pb2.py
+++ b/tensorflow2fluid/src/framework_pb2.py
--- a/tensorflow2fluid/src/graph.py
+++ b/tensorflow2fluid/src/graph.py
--- a/tensorflow2fluid/src/name_generator.py
+++ b/tensorflow2fluid/src/name_generator.py
@@ -12,35 +12,41 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.

+import paddle.fluid as fluid
+import sys

-class NameGenerator(object):
-    def __init__(self):
-        self.param_index = 0
-        self.input_index = 0
-        self.net_index = 0
-        self.const_index = 0
-        self.names = dict()

-    def get_name(self, node):
-        ref_name = None
-        op_name = node.layer_type
+class ModelLoader(object):
+    def __init__(self, model_dir, use_cuda=False):
+        sys.path.append(model_dir)
+        mymodel = __import__("mymodel")
+        self.model = mymodel.Model()
+        self.model.build()
+        self.inputs = self.model.inputs
+        self.outputs = self.model.outputs
+        if use_cuda:
+            self.exe = fluid.Executor(fluid.CUDAPlace(0))
+        else:
+            self.exe = fluid.Executor(fluid.CPUPlace())
+        self.exe.run(fluid.default_startup_program())

-        if node.layer.name in self.names:
-            return self.names[node.layer.name]
+        var_list = list()
+        global_block = fluid.default_main_program().global_block()
+        with open(model_dir + "/save_var.list") as f:
+            for line in f:
+                try:
+                    var = global_block.var(line.strip())
+                    var_list.append(var)
+                except:
+                    pass
+        fluid.io.load_vars(self.exe, model_dir, vars=var_list)
+        self.program = fluid.default_main_program()

-        if op_name == "variablev2":
-            ref_name = "param_" + str(self.param_index)
-            self.param_index += 1
-        elif op_name == "placeholder":
-            ref_name = "input_" + str(self.input_index)
-            self.input_index += 1
-        elif op_name == "const":
-            ref_name = "const_" + str(self.const_index)
-            self.const_index += 1
-        elif op_name.lower() == "identity":
-            ref_name = self.names[node.layer.input[0]]
-        else:
-            ref_name = "net_" + str(self.net_index)
-            self.net_index += 1
-        self.names[node.layer.name] = ref_name
-        return ref_name
+    def save_inference_model(self, save_dir):
+        fluid.io.save_inference_model(save_dir, self.model.inputs,
+                                      self.model.outputs, self.exe)
+
+    def inference(self, feed_dict):
+        result = self.exe.run(
+            self.program, feed=feed_dict, fetch_list=self.model.outputs)
+        return result
--- a/tensorflow2fluid/src/paddle_emitter.py
+++ b/tensorflow2fluid/src/paddle_emitter.py
--- a/tensorflow2fluid/src/tensorflow_graph.py
+++ b/tensorflow2fluid/src/tensorflow_graph.py
@@ -16,6 +16,7 @@ from graph import GraphNode, Graph
 from tensorflow.core.framework import attr_value_pb2
 from utils import *

+
 class TensorflowGraphNode(GraphNode):
    dtype_map = {1: "float32", 3: "int32", 9: "int64"}

@@ -64,18 +65,13 @@ class TensorflowGraphNode(GraphNode):
                return val if isinstance(val, bytes) else val
        else:
            return default_value
-    
+
    def clear_code(self):
        self.code.clear()


 class TensorflowGraph(Graph):
-    useless_type = [
-        'identity', 
-        'placeholderwithdefault', 
-        'switch', 
-        'merge'
-        ]
+    useless_type = ['identity', 'placeholderwithdefault', 'switch', 'merge']

    def __init__(self, tf_graph):
        super(TensorflowGraph, self).__init__(tf_graph)
@@ -84,7 +80,8 @@ class TensorflowGraph(Graph):
    def build(self, input_format):
        skip_node = set(['const'])
        for i, layer in enumerate(self.tf_graph.node):
-            self.node_map[layer.name] = TensorflowGraphNode(layer, input_format)
+            self.node_map[layer.name] = TensorflowGraphNode(
+                layer, input_format)

        for i, layer in enumerate(self.tf_graph.node):
            if layer.op.lower() in skip_node:
@@ -94,22 +91,22 @@ class TensorflowGraph(Graph):
                        ':')[0] in self.node_map:
                    pred_node = self.node_map[pred.split(':')[0]]
                    if pred_node.layer_type == "switch":
-                        self._make_connection(pred_node, 
-                            self.node_map[layer.name])
+                        self._make_connection(pred_node,
+                                              self.node_map[layer.name])
                    elif pred_node.layer_type == "split" or \
                        pred_node.layer_type == "splitv":
                        self.node_map[pred] = TensorflowGraphNode(
                            pred_node.layer, input_format, pred)
-                        self._make_connection(self.node_map[pred], 
-                            self.node_map[layer.name])
+                        self._make_connection(self.node_map[pred],
+                                              self.node_map[layer.name])
                        self._make_connection(pred_node, self.node_map[pred])
                    else:
                        raise Exception("Unsupported situation(name:[{}], \
                            OP[{}])".format(node.layer_name, node.layer_type))

                elif pred in self.node_map:
-                    self._make_connection(self.node_map[pred], 
-                        self.node_map[layer.name])
+                    self._make_connection(self.node_map[pred],
+                                          self.node_map[layer.name])

                else:
                    raise Exception("input: {} not in node_map".format(pred))

--- a/tensorflow2fluid/src/tensorflow_parser.py
+++ b/tensorflow2fluid/src/tensorflow_parser.py
@@ -19,6 +19,7 @@ from tensorflow.python.tools import strip_unused_lib
 from tensorflow.python.framework import dtypes
 import numpy

+
 class TensorflowCkptParser(object):
    def __init__(self,
                 meta_file,
@@ -29,21 +30,22 @@ class TensorflowCkptParser(object):
                 input_format="NCHW".encode()):
        graph_def = None
        self.weights = None
+        self.inputs = in_nodes
+        self.outputs = dest_nodes
        sess = tf.Session()
        if meta_file is None:
            raise Exception("meta_file must be provided")
        new_saver = tf.train.import_meta_graph(meta_file)
        if checkpoint_file is not None:
            self.weights = dict()
-            new_saver.restore(
-                sess, tf.train.latest_checkpoint(checkpoint_file))
+            new_saver.restore(sess,
+                              tf.train.latest_checkpoint(checkpoint_file))
            for var in tf.global_variables():
                value = var.eval(sess)
                self.weights[var.name.split(':')[0]] = value

        self.infer = ModelInfer(sess)
-        graph_def, ver = tf.get_default_graph()._as_graph_def(
-            add_shapes=True)
+        graph_def, ver = tf.get_default_graph()._as_graph_def(add_shapes=True)

        if in_nodes is not None and input_shape is not None:
            graph_def = strip_unused_lib.strip_unused(
@@ -58,7 +60,8 @@ class TensorflowCkptParser(object):
                    shape = [tf.Dimension(x) for x in input_shape[index]]
                    shape_proto = tf.TensorShape(shape).as_proto()
                    node.attr['_output_shapes'].list.shape.pop()
-                    node.attr['_output_shapes'].list.shape.extend([shape_proto])
+                    node.attr['_output_shapes'].list.shape.extend(
+                        [shape_proto])
                    self.infer.gen_sample_data(node.name, input_shape[index])

            self.tf_graph = TensorflowGraph(graph_def)
@@ -69,14 +72,20 @@ class TensorflowCkptParser(object):


 class TensorflowPbParser(object):
-    def __init__(self, pb_file, dest_nodes, input_shape=None, 
-        in_nodes=None, input_format="NCHW".encode()):
+    def __init__(self,
+                 pb_file,
+                 dest_nodes,
+                 input_shape=None,
+                 in_nodes=None,
+                 input_format="NCHW".encode()):
        with open(pb_file, 'rb') as f:
            serialized = f.read()
        tf.reset_default_graph()
        original_graph_def = tf.GraphDef()
        original_graph_def.ParseFromString(serialized)
-        
+        self.inputs = list()
+        self.outputs = dest_nodes
+
        sess = tf.Session(graph=tf.get_default_graph())
        sess.run(tf.global_variables_initializer())
        self.infer = ModelInfer(sess)
@@ -111,11 +120,11 @@ class TensorflowPbParser(object):
                raise Exception("Unexpected dtype for input, only support " \
                    "float32 and int32 now")
            input_map[in_nodes[i] + ":0"] = x
+            self.inputs.append(x.name.split(':')[0])
            self.infer.gen_sample_data(x.name, input_shape[i])

        tf.import_graph_def(graph_def, name="", input_map=input_map)
-        graph_def = tf.get_default_graph()._as_graph_def(
-            add_shapes=True)[0]
+        graph_def = tf.get_default_graph()._as_graph_def(add_shapes=True)[0]

        self.tf_graph = TensorflowGraph(graph_def)
        self.tf_graph.build(input_format)
@@ -164,7 +173,7 @@ class ModelInfer(object):
        if len(tensor_name.split(':')) < 2:
            tensor_name = tensor_name + ':0'
        output_tensor = self.sess.graph.get_tensor_by_name(tensor_name)
- 
+
        tensor_values = []
        for i in range(0, 3):
            inputs_tensors = dict()
@@ -175,19 +184,19 @@ class ModelInfer(object):
                inputs_tensors[tensor] = values[i]
            r, = self.sess.run([output_tensor], inputs_tensors)
            tensor_values.append(r.flatten())
- 
+
        compare01 = (tensor_values[0] == tensor_values[1])
        compare12 = (tensor_values[1] == tensor_values[2])
- 
+
        if compare01.all() and compare12.all():
            return tensor_values[0]
-  
+
        if (compare01 == compare12).all():
-            index = numpy.argwhere(compare01==False).flatten()
+            index = numpy.argwhere(compare01 == False).flatten()
            if index.shape[0] != 1:
                raise Exception("There's not only one unstable dimension")
            tensor_values[0][index[0]] = -1
- 
+
            index = numpy.argwhere(tensor_values[0] < 0).flatten()
            if index.shape[0] > 2:
                raise Exception("There's more than two values less than zero")
@@ -199,17 +208,17 @@ class ModelInfer(object):
            return tensor_values[0]
        else:
            raise Exception("Can not infer a stable shape tensor value")
- 
+
    def get_tensor_shape(self, layer):
        shape = layer.attr['_output_shapes'].list.shape[0]
        shape = numpy.array([dim.size for dim in shape.dim])
-        if numpy.argwhere(shape<0).shape[0] <= 1:
+        if numpy.argwhere(shape < 0).shape[0] <= 1:
            return shape
        tensor_name = layer.name
        if len(tensor_name.split(':')) < 2:
            tensor_name = tensor_name + ':0'
        output_tensor = self.sess.graph.get_tensor_by_name(tensor_name)
- 
+
        shapes = []
        for i in range(0, 3):
            inputs_tensors = dict()
@@ -220,15 +229,15 @@ class ModelInfer(object):
                inputs_tensors[tensor] = values[i]
            r, = self.sess.run([output_tensor], inputs_tensors)
            shapes.append(numpy.array(r.shape))
- 
+
        compare01 = (shapes[0] == shapes[1])
        compare12 = (shapes[1] == shapes[2])
- 
+
        if compare01.all() and compare12.all():
            return shapes[0]
-  
+
        if (compare01 == compare12).all():
-            index = numpy.argwhere(compare01==False).flatten()
+            index = numpy.argwhere(compare01 == False).flatten()
            if index.shape[0] != 1:
                raise Exception("There's not only one unstable dimension")
            if index[0] != 0:
@@ -237,13 +246,13 @@ class ModelInfer(object):
            return shapes[0]
        else:
            raise Exception("Can not infer a stable tensor shape, failed!")
- 
+
    def get_const_tensor_value(self, layer):
        tensor_name = layer.name
        if len(tensor_name.split(':')) < 2:
            tensor_name = tensor_name + ':0'
        output_tensor = self.sess.graph.get_tensor_by_name(tensor_name)
- 
+
        result = []
        for i in range(0, 3):
            inputs_tensors = dict()
@@ -254,10 +263,10 @@ class ModelInfer(object):
                inputs_tensors[tensor] = values[i]
            r, = self.sess.run([output_tensor], inputs_tensors)
            result.append(r)
- 
+
        compare01 = (result[0] == result[1])
        compare12 = (result[1] == result[2])
- 
+
        if compare01.all() and compare12.all():
            return result[0]
        else:

--- a/tensorflow2fluid/src/utils.py
+++ b/tensorflow2fluid/src/utils.py
@@ -22,7 +22,6 @@ VALID = 'VALID'.encode()
 class NameGenerator(object):
    def __init__(self):
        self.param_index = 0
-        self.input_index = 0
        self.net_index = 0
        self.const_index = 0
        self.names = dict()
@@ -38,8 +37,7 @@ class NameGenerator(object):
            ref_name = "param_" + str(self.param_index)
            self.param_index += 1
        elif op_name == "placeholder":
-            ref_name = "input_" + str(self.input_index)
-            self.input_index += 1
+            ref_name = node.layer.name
        elif op_name == "const":
            ref_name = "const_" + str(self.const_index)
            self.const_index += 1
@@ -76,11 +74,13 @@ class LayerCode(object):
        layer_code2 = ""
        for k, v in self.param_attr.items():
            layer_code2 = layer_code2 + k + "=" + "{}".format(v) + ", "
-        layer_code2 = layer_code2.strip(", ")         
+        layer_code2 = layer_code2.strip(", ")

-        layer_code = (layer_code0 + layer_code1 + layer_code2).strip(", ") + ")"
+        layer_code = (
+            layer_code0 + layer_code1 + layer_code2).strip(", ") + ")"
        return layer_code

+
 class FluidCode(object):
    def __init__(self):
        self.codes = list()