update code for ensemble

3ac52f6a · barrierye · b473a896 · 3ac52f6a · 3ac52f6a · 3ac52f6a
20 changed file
--- a/core/general-server/op/general_copy_op.cpp
+++ b/core/general-server/op/general_copy_op.cpp
--- a/core/general-server/op/general_copy_op.h
+++ b/core/general-server/op/general_copy_op.h
--- a/core/general-server/op/general_dist_kv_infer_op.cpp
+++ b/core/general-server/op/general_dist_kv_infer_op.cpp
--- a/core/general-server/op/general_dist_kv_infer_op.h
+++ b/core/general-server/op/general_dist_kv_infer_op.h
--- a/core/general-server/op/general_dist_kv_quant_infer_op.cpp
+++ b/core/general-server/op/general_dist_kv_quant_infer_op.cpp
--- a/core/general-server/op/general_dist_kv_quant_infer_op.h
+++ b/core/general-server/op/general_dist_kv_quant_infer_op.h
--- a/core/general-server/op/general_infer_op.cpp
+++ b/core/general-server/op/general_infer_op.cpp
@@ -37,29 +37,55 @@ using baidu::paddle_serving::predictor::PaddleGeneralModelConfig;
 int GeneralInferOp::inference() {
  VLOG(2) << "Going to run inference";
-  const GeneralBlob *input_blob = get_depend_argument<GeneralBlob>(pre_name());
+  //const GeneralBlob *input_blob = get_depend_argument<GeneralBlob>(pre_name());
-  VLOG(2) << "Get precedent op name: " << pre_name();
  GeneralBlob *output_blob = mutable_data<GeneralBlob>();
+  VLOG(2) << "finish get output_blob";
-  if (!input_blob) {
-    LOG(ERROR) << "Failed mutable depended argument, op:" << pre_name();
-    return -1;
-  }
-  const TensorVector *in = &input_blob->tensor_vector;
  TensorVector *out = &output_blob->tensor_vector;
-  int batch_size = input_blob->GetBatchSize();
+  VLOG(2) << "finish get *out";
-  VLOG(2) << "input batch size: " << batch_size;
+  const std::vector<std::string> pre_node_names = pre_names();
+  VLOG(2) << "pre node names size: " << pre_node_names.size();
+  TensorVector input;
+  int batch_size = 0;
+  const GeneralBlob *input_blob;
+  for (int i = 0; i < (int)pre_node_names.size(); ++i) {
+    VLOG(2) << "pre names[" << i << "]: "
+            << pre_node_names[i];
+    input_blob =
+        get_depend_argument<GeneralBlob>(pre_node_names[i]);
+    fprintf(stderr, "input blob address %x\n", input_blob);
+    if (!input_blob) {
+      LOG(ERROR) << "Failed mutable depended argument, op:" << pre_node_names[i];
+      return -1;
+    }
+    batch_size = input_blob->GetBatchSize();
+    VLOG(2) << "batch size of input: " << batch_size;
+    for (int j = 0; j < input_blob->tensor_vector.size(); ++j) {
+      VLOG(2) << "input tensor[" << j << "]: "
+              << input_blob->tensor_vector[j].name;
+      input.push_back(input_blob->tensor_vector[j]);
+      VLOG(2) << "add an input tensor name: " << input_blob->tensor_vector[j].name;
+    }
+  }
-  output_blob->SetBatchSize(batch_size);
+  VLOG(2) << "get output blob done.";
+  const TensorVector *in = &input;
+  VLOG(2) << "get input done.";
+  batch_size = 1;
  VLOG(2) << "infer batch size: " << batch_size;
+  output_blob->SetBatchSize(batch_size);
  Timer timeline;
  int64_t start = timeline.TimeStampUS();
  timeline.Start();
-  BLOG("engine name: %s", engine_name().c_str());
+  VLOG(2) << "input of op " << op_name();
+  for (int i = 0; i < in->size(); ++i) {
+    VLOG(2) << in->at(i).name;
+  }
+  VLOG(2) << "get engine name: " << engine_name().c_str();
  if (InferManager::instance().infer(
          GeneralInferOp::engine_name().c_str(), in, out, batch_size)) {
    LOG(ERROR) << "Failed do infer in fluid model: "
@@ -67,6 +93,11 @@ int GeneralInferOp::inference() {
    return -1;
  }
+  VLOG(2) << "output of op " << op_name();
+  for (int i = 0; i < out->size(); ++i) {
+    VLOG(2) << out->at(i).name;
+  }
  int64_t end = timeline.TimeStampUS();
  CopyBlobInfo(input_blob, output_blob);
  AddBlobInfo(output_blob, start);

--- a/core/general-server/op/general_reader_op.cpp
+++ b/core/general-server/op/general_reader_op.cpp
@@ -21,9 +21,6 @@
 #include "core/predictor/framework/infer.h"
 #include "core/predictor/framework/memory.h"
 #include "core/util/include/timer.h"
-#define BLOG(fmt, ...) \
-  printf(              \
-      "[%s:%s]:%d " fmt "\n", __FILE__, __FUNCTION__, __LINE__, ##__VA_ARGS__)
 namespace baidu {
 namespace paddle_serving {
@@ -101,7 +98,6 @@ int GeneralReaderOp::inference() {
      baidu::paddle_serving::predictor::Resource::instance();
  VLOG(2) << "get resource pointer done.";
-  BLOG("engine name: %s", engine_name().c_str());
  std::shared_ptr<PaddleGeneralModelConfig> model_config =
      resource.get_general_model_config();

--- a/core/general-server/op/general_response_op.cpp
+++ b/core/general-server/op/general_response_op.cpp
@@ -37,10 +37,13 @@ using baidu::paddle_serving::predictor::InferManager;
 using baidu::paddle_serving::predictor::PaddleGeneralModelConfig;
 int GeneralResponseOp::inference() {
-  const GeneralBlob *input_blob = get_depend_argument<GeneralBlob>(pre_name());
+  const std::vector<std::string> pre_node_names = pre_names();
+  VLOG(2) << "pre node names size: " << pre_node_names.size();
+  const GeneralBlob *input_blob = get_depend_argument<GeneralBlob>(pre_node_names[0]);
  if (!input_blob) {
-    LOG(ERROR) << "Failed mutable depended argument, op: " << pre_name();
+    LOG(ERROR) << "Failed mutable depended argument, op: " << pre_node_names[0];
    return -1;
  }

--- a/core/general-server/op/general_text_response_op.cpp
+++ b/core/general-server/op/general_text_response_op.cpp
@@ -36,10 +36,13 @@ using baidu::paddle_serving::predictor::InferManager;
 using baidu::paddle_serving::predictor::PaddleGeneralModelConfig;
 int GeneralTextResponseOp::inference() {
-  const GeneralBlob *input_blob = get_depend_argument<GeneralBlob>(pre_name());
+  const std::vector<std::string> pre_node_names = pre_names();
+  VLOG(2) << "pre node names size: " << pre_node_names.size();
+  const GeneralBlob *input_blob = get_depend_argument<GeneralBlob>(pre_node_names[0]);
  if (!input_blob) {
-    LOG(ERROR) << "Failed mutable depended argument, op: " << pre_name();
+    LOG(ERROR) << "Failed mutable depended argument, op: " << pre_node_names[0];
    return -1;
  }

--- a/core/predictor/framework/channel.h
+++ b/core/predictor/framework/channel.h
@@ -152,9 +152,13 @@ class OpChannel : public Channel {
  // functions of derived class
-  T* data() { return &_data; }
+  T* data() {
+      LOG(INFO) << "get data from channel.";
+      return &_data; }
-  const T* data() const { return &_data; }
+  const T* data() const { 
+      LOG(INFO) << "get data from channel.";
+      return &_data; }
  Channel& operator=(const T& obj) {
    _data = obj;

--- a/core/predictor/framework/dag_view.cpp
+++ b/core/predictor/framework/dag_view.cpp
@@ -33,6 +33,7 @@ namespace paddle_serving {
 namespace predictor {
 int DagView::init(Dag* dag, const std::string& service_name) {
+  BLOG("DagView::init.");
  _name = dag->name();
  _full_name = service_name + NAME_DELIMITER + dag->name();
  _bus = butil::get_object<Bus>();
@@ -89,20 +90,30 @@ int DagView::init(Dag* dag, const std::string& service_name) {
      vnode->conf = node;
      vnode->op = op;
+      // Add depends
+      for (auto it = vnode->conf->depends.begin(); 
+              it != vnode->conf->depends.end(); ++it) {
+        std::string pre_node_name = it->first;
+        VLOG(2) << "add op pre name: \n"
+                << "current op name: " << vnode->op->op_name()
+                << ", previous op name: " << pre_node_name;
+        vnode->op->add_pre_node_name(pre_node_name);
+      }
      vstage->nodes.push_back(vnode);
    }
    // TODO(guru4elephant): this seems buggy, please review later
-    if (si > 0) {
+    /*if (si > 0) {*/
-      VLOG(2) << "set op pre name: \n"
+      //VLOG(2) << "set op pre name: \n"
-              << "current op name: " << vstage->nodes.back()->op->op_name()
+              //<< "current op name: " << vstage->nodes.back()->op->op_name()
-              << " previous op name: "
+              //<< " previous op name: "
-              << _view[si - 1]->nodes.back()->op->op_name();
+              //<< _view[si - 1]->nodes.back()->op->op_name();
-      vstage->nodes.back()->op->set_pre_node_name(
+      //vstage->nodes.back()->op->set_pre_node_name(
-          _view[si - 1]->nodes.back()->op->op_name());
+          //_view[si - 1]->nodes.back()->op->op_name());
-    }
+    /*}*/
    _view.push_back(vstage);
  }
+  BLOG("DagView::finish.");
  return ERR_OK;
 }

--- a/core/predictor/framework/workflow.cpp
+++ b/core/predictor/framework/workflow.cpp
@@ -16,6 +16,7 @@
 #include <string>
 #include "core/predictor/common/inner_common.h"
 #include "core/predictor/framework/predictor_metric.h"  // PredictorMetric
+#define BLOG(fmt, ...) printf("[%s:%s]:%d "fmt"\n", __FILE__, __FUNCTION__, __LINE__, ##__VA_ARGS__)
 namespace baidu {
 namespace paddle_serving {
@@ -51,6 +52,7 @@ DagView* Workflow::fetch_dag_view(const std::string& service_name) {
 }
 void Workflow::return_dag_view(DagView* view) {
+  BLOG("Workflow::return_dag_vie");
  view->deinit();
  if (_type == "Sequence") {
    butil::return_object<DagView>(view);

--- a/core/predictor/op/op.cpp
+++ b/core/predictor/op/op.cpp
@@ -66,6 +66,7 @@ int Op::init(Bus* bus,
    return -1;
  }
+  _pre_node_names.clear();
  return custom_init();
 }

--- a/core/predictor/op/op.h
+++ b/core/predictor/op/op.h
@@ -94,6 +94,10 @@ class Op {
  template <typename T>
  T* mutable_data() {
    Channel* channel = mutable_channel();
+    LOG(INFO) << "succ to get channel!";
+    auto x = (dynamic_cast<OpChannel<T>*>(channel))->data();
+    LOG(INFO) << "succ to x!";
+    return x;
    return (dynamic_cast<OpChannel<T>*>(channel))->data();
  }
@@ -132,12 +136,16 @@ class Op {
  const std::string& full_name() const { return _full_name; }
-  const std::string& pre_name() const { return _pre_node_name; }
+  //const std::string& pre_name() const { return _pre_node_name; }
+  const std::vector<std::string>& pre_names() const { return _pre_node_names; }
  void set_full_name(const std::string full_name) { _full_name = full_name; }
-  void set_pre_node_name(const std::string pre_name) {
+  /*void set_pre_node_name(const std::string pre_name) {*/
-    _pre_node_name = pre_name;
+    //_pre_node_name = pre_name;
+  /*}*/
+  void add_pre_node_name(const std::string pre_name) {
+    _pre_node_names.push_back(pre_name);
  }
  const std::string& type() const;
@@ -199,7 +207,8 @@ class Op {
  Bus* _bus;
  Dag* _dag;
  uint32_t _id;
-  std::string _pre_node_name;  // only for sequential execution
+  //std::string _pre_node_name;  // only for sequential execution
+  std::vector<std::string> _pre_node_names;  // for dag execution
  std::string _name;
  std::string _full_name;  // service_workflow_stageindex_opname
  std::string _type;
@@ -222,15 +231,20 @@ class OpWithChannel : public Op {
  // ---------- Implements ----------
  Channel* mutable_channel() {
+    LOG(INFO) << "op->mutable_data";
    if (_channel != NULL) {
+      LOG(INFO) << "op->mutable_data: return _channel";
      return _channel;
    }
+    LOG(INFO) << "op->mutable_data: _channel == NULL";
    _channel = butil::get_object<ChannelType>();
    if (!_channel) {
+      LOG(INFO) << "op->mutable_data: fail to get _channel";
      LOG(ERROR) << "Failed mutable channel of type:" << typeid(T).name();
      return NULL;
    }
+    LOG(INFO) << "op->mutable_data: succ to get _channel";
    _channel->init(this->id(), this->name());
    return _channel;
  }

--- a/ensemble-demo/client.py
+++ b/ensemble-demo/client.py
+# Copyright (c) 2020 PaddlePaddle Authors. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# pylint: disable=doc-string-missing
+from paddle_serving_client import Client
+from imdb_reader import IMDBDataset
+import sys
+client = Client()
+client.load_client_config('imdb_bow_client_conf/serving_client_conf.prototxt')
+client.connect(["127.0.0.1:9393"])
+# you can define any english sentence or dataset here
+# This example reuses imdb reader in training, you
+# can define your own data preprocessing easily.
+imdb_dataset = IMDBDataset()
+imdb_dataset.load_resource('imdb.vocab')
+for i in range(40):
+    line = 'i am very sad | 0'
+    word_ids, label = imdb_dataset.get_words_and_label(line)
+    feed = {"words": word_ids}
+    fetch = ["acc", "cost", "prediction"]
+    fetch_map = client.predict(feed=feed, fetch=fetch)
+    print("{} {}".format(i, fetch_map["prediction"][1]))
+    exit(0)
+print('0.633530199528')
--- a/ensemble-demo/get_data.sh
+++ b/ensemble-demo/get_data.sh
+wget --no-check-certificate https://fleet.bj.bcebos.com/text_classification_data.tar.gz
+wget --no-check-certificate https://paddle-serving.bj.bcebos.com/imdb-demo/imdb_model.tar.gz
+tar -zxvf text_classification_data.tar.gz
+tar -zxvf imdb_model.tar.gz
--- a/ensemble-demo/server.py
+++ b/ensemble-demo/server.py
+# Copyright (c) 2020 PaddlePaddle Authors. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# pylint: disable=doc-string-missing
+import os
+import sys
+from paddle_serving_server import OpMaker
+from paddle_serving_server import OpSeqMaker
+from paddle_serving_server import Server
+op_maker = OpMaker()
+read_op = op_maker.create('general_reader')
+g1_infer_op = op_maker.create('general_infer', node_name='g1')
+g2_infer_op = op_maker.create('general_infer', node_name='g2')
+add_op = op_maker.create('general_add')
+response_op = op_maker.create('general_response')
+op_seq_maker = OpSeqMaker()
+op_seq_maker.add_op(read_op)
+op_seq_maker.add_op(g1_infer_op, dependent_nodes=[read_op])
+op_seq_maker.add_op(g2_infer_op, dependent_nodes=[read_op])
+op_seq_maker.add_op(add_op, dependent_nodes=[g1_infer_op, g2_infer_op])
+op_seq_maker.add_op(response_op, dependent_nodes=[add_op])
+server = Server()
+server.set_op_sequence(op_seq_maker.get_op_sequence())
+# server.load_model_config(sys.argv[1])
+model_configs = {'g1': 'imdb_bow_model', 'g2': 'imdb_cnn_model'}
+server.load_model_config(model_configs)
+server.prepare_server(workdir="work_dir1", port=9393, device="cpu")
+server.run_server()
--- a/ensemble-demo/server.seq.py
+++ b/ensemble-demo/server.seq.py
+# Copyright (c) 2020 PaddlePaddle Authors. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# pylint: disable=doc-string-missing
+import os
+import sys
+from paddle_serving_server import OpMaker
+from paddle_serving_server import OpSeqMaker
+from paddle_serving_server import Server
+op_maker = OpMaker()
+read_op = op_maker.create('general_reader')
+infer_op = op_maker.create('general_infer')
+response_op = op_maker.create('general_response')
+op_seq_maker = OpSeqMaker()
+op_seq_maker.add_op(read_op)
+op_seq_maker.add_op(infer_op, dependent_nodes=[read_op])
+op_seq_maker.add_op(response_op, dependent_nodes=[infer_op])
+server = Server()
+server.set_op_sequence(op_seq_maker.get_op_sequence())
+# server.load_model_config(sys.argv[1])
+model_configs = {'general_infer_op': 'imdb_bow_model'}
+server.load_model_config(model_configs)
+server.prepare_server(workdir="work_dir1", port=9393, device="cpu")
+server.run_server()
--- a/python/paddle_serving_server/__init__.py
+++ b/python/paddle_serving_server/__init__.py
@@ -34,7 +34,8 @@ class OpMaker(object):
            "general_single_kv": "GeneralSingleKVOp",
            "general_dist_kv_infer": "GeneralDistKVInferOp",
            "general_dist_kv_quant_infer": "GeneralDistKVQuantInferOp",
-            "general_copy": "GeneralCopyOp"
+            "general_copy": "GeneralCopyOp",
+            "general_add": "GeneralAddOp"
        }
    # currently, inputs and outputs are not used