support combine format fluid model

c6554d1c · liuruilong · 262bab3d · c6554d1c · c6554d1c · c6554d1c
隐藏空白更改
内联并排

Showing with 19 addition and 28 deletion

CMakeLists.txt CMakeLists.txt +10 -7

src/io/io.cpp src/io/io.cpp +5 -15

src/io/io.h src/io/io.h +1 -2

test/net/test_googlenet.cpp test/net/test_googlenet.cpp +3 -4

未找到文件。
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -5,19 +5,22 @@ option(DEBUGING "enable debug mode" OFF)
 option(USE_OPENMP "openmp support" OFF)
 option(USE_EXCEPTION "use std exception" OFF)
+set(CMAKE_BUILD_TYPE Debug)
 if (DEBUGING)
-    set(CMAKE_BUILD_TYPE Debug)
 else()
-    set(CMAKE_BUILD_TYPE Release)
+#    set(CMAKE_BUILD_TYPE Release)
 endif ()
+add_definitions(-DPADDLE_MOBILE_DEBUG)
 if(DEBUGING)
-    message(STATUS "debuging")
+#    message(STATUS "debuging")
-    add_definitions(-DPADDLE_MOBILE_DEBUG)
 else()
-    message(STATUS "releasing")
+#    message(STATUS "releasing")
-    add_definitions(-fvisibility=hidden -fvisibility-inlines-hidden)
+#    add_definitions(-fvisibility=hidden -fvisibility-inlines-hidden)
 endif()
 if (USE_EXCEPTION)
@@ -122,8 +125,8 @@ endif()
 add_library(paddle-mobile SHARED ${PADDLE_MOBILE_CC} ${PADDLE_MOBILE_H})
+add_subdirectory(test)
 if(DEBUGING)
-    add_subdirectory(test)
 endif()
--- a/src/io/io.cpp
+++ b/src/io/io.cpp
@@ -279,17 +279,14 @@ Executor<Dtype, P>::Executor(const framework::Program<Dtype> p, int batch_size,
 template <typename Dtype, Precision P>
 void Executor<Dtype, P>::LoadMemory(const framework::VarDesc var_desc,
-                                    framework::LoDTensor *tensor,
+                                    framework::LoDTensor *tensor, char *&data) {
-                                    const std::string &file_path, char *data) {
  // 1. version
  uint32_t version = *(uint32_t *)data;
  data += sizeof(uint32_t);
-  DLOG << "version: " << version;
  // 2 Lod information
  uint64_t lod_level = *(uint64_t *)data;
  data += sizeof(uint64_t);
-  DLOG << "lod_level: " << lod_level;
  auto &lod = *tensor->mutable_lod();
  lod.resize(lod_level);
@@ -297,7 +294,6 @@ void Executor<Dtype, P>::LoadMemory(const framework::VarDesc var_desc,
    uint64_t size = *(uint64_t *)data;
    data += sizeof(uint64_t);
    DLOG << "lod size: " << i << size;
    std::vector<size_t> tmp(size / sizeof(size_t));
    for (int k = 0; k < tmp.size(); ++k) {
@@ -315,12 +311,10 @@ void Executor<Dtype, P>::LoadMemory(const framework::VarDesc var_desc,
  // 3. tensor version
  uint32_t tensor_version = *(uint32_t *)data;
  data += sizeof(uint32_t);
-  DLOG << "tensor_version: " << tensor_version;
  // 4. tensor desc
  int32_t size = *(int32_t *)data;
  data += sizeof(int32_t);
-  DLOG << "tensor desc size: " << size;
  std::unique_ptr<char[]> buf(new char[size]);
  for (int m = 0; m < size; ++m) {
@@ -344,7 +338,6 @@ void Executor<Dtype, P>::LoadMemory(const framework::VarDesc var_desc,
      break;
    case framework::VARTYPE_TYPE_FP32:
      type_size = 4;
-      DLOG << " type size: " << type_size;
      memory = tensor->mutable_data<float>();
      break;
    case framework::VARTYPE_TYPE_FP64:
@@ -382,8 +375,8 @@ void Executor<Dtype, P>::InitMemory() {
        char *origin_data =
            Get_binary_data(program_.model_path + "/" + var_desc->Name());
-        LoadMemory(*var_desc, tensor,
+        char *data = origin_data;
-                   program_.model_path + "/" + var_desc->Name(), origin_data);
+        LoadMemory(*var_desc, tensor, data);
        delete origin_data;
      } else {
        if (var_desc->Type() == framework::VARTYPE_TYPE_LOD_TENSOR) {
@@ -399,7 +392,7 @@ void Executor<Dtype, P>::InitMemory() {
 template <typename Dtype, Precision P>
 void Executor<Dtype, P>::InitCombineMemory() {
  char *origin_data = Get_binary_data(program_.para_path);
+  char *data = origin_data;
  for (const auto &block : to_predict_program_->Blocks()) {
    for (const auto &var_desc : block->Vars()) {
      auto var = program_.scope->Var(var_desc->Name());
@@ -408,18 +401,15 @@ void Executor<Dtype, P>::InitCombineMemory() {
        if (var_desc->Name() == "feed" || var_desc->Name() == "fetch") {
          continue;
        }
-        LoadMemory(*var_desc, tensor,
+        LoadMemory(*var_desc, tensor, data);
-                   program_.model_path + "/" + var_desc->Name(), origin_data);
      } else {
        if (var_desc->Type() == framework::VARTYPE_TYPE_LOD_TENSOR) {
          auto tensor = var->template GetMutable<framework::LoDTensor>();
          tensor->template mutable_data<Ptype>();
        }
      }
    }
  }
  delete origin_data;
 }

--- a/src/io/io.h
+++ b/src/io/io.h
@@ -63,8 +63,7 @@ class Executor {
  void InitMemory();
  void LoadMemory(const framework::VarDesc var_desc,
-                  framework::LoDTensor *tensor, const std::string &file_path,
+                  framework::LoDTensor *tensor, char *&data);
-                  char *data);
  void InitCombineMemory();
  framework::Program<Dtype> program_;
  int batch_size_ = 1;

--- a/test/net/test_googlenet.cpp
+++ b/test/net/test_googlenet.cpp
@@ -20,10 +20,9 @@ int main() {
  paddle_mobile::Loader<paddle_mobile::CPU> loader;
  bool optimize = false;
  auto time1 = time();
+  //  auto program = loader.Load(g_googlenet, optimize);
-  auto program = loader.Load(g_googlenet, optimize);
+  auto program = loader.Load(g_googlenet_combine + "/model",
-  //  auto program = loader.Load(g_googlenet_combine + "/model",
+                             g_googlenet_combine + "/params", optimize);
-  //          g_googlenet_combine + "/params", optimize);
  auto time2 = time();
  DLOG << "load cost :" << time_diff(time1, time2) << "ms\n";
  paddle_mobile::Executor<paddle_mobile::CPU> executor(program, 1, optimize);