/* Copyright (c) 2018 PaddlePaddle Authors. All Rights Reserved. Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at http://www.apache.org/licenses/LICENSE-2.0 Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License. */ #include "io.h" #include #include #include "common/log.h" #include "common/enforce.h" #include "framework/framework.pb-c.h" #include "framework/lod_tensor.h" #include "framework/operator.h" #include "framework/program/program-optimize/program_optimize.h" #include "framework/program/program_desc.h" #include "framework/program/var_desc.h" #include "framework/scope.h" #include "framework/tensor.h" namespace paddle_mobile { using framework::Variable; void ReadBinaryFile(const std::string &filename, std::string *contents) { std::ifstream fin(filename, std::ios::in | std::ios::binary); PADDLE_MOBILE_ENFORCE(fin.is_open(), "open file: %s failed", filename.c_str()); fin.seekg(0, std::ios::end); contents->clear(); contents->resize(fin.tellg()); fin.seekg(0, std::ios::beg); fin.read(&(contents->at(0)), contents->size()); fin.close(); } static size_t ReadBuffer(const char *file_name, uint8_t **out) { printf("%s \n", file_name); FILE *fp; fp = fopen(file_name, "rb"); PADDLE_MOBILE_ENFORCE(fp != NULL, " %s open failed !", file_name); fseek(fp, 0, SEEK_END); size_t size = ftell(fp); rewind(fp); DLOG << "model size: " << size; *out = reinterpret_cast(malloc(size)); size_t cur_len = 0; size_t nread; while ((nread = fread(*out + cur_len, 1, size - cur_len, fp)) != 0) { cur_len += nread; } fclose(fp); return cur_len; } template void Loader::LoadVar(framework::Variable *variable, const framework::VarDesc &var_desc, const std::string &file_path) { auto tensor = variable->GetMutable(); std::ifstream is(file_path); PADDLE_MOBILE_ENFORCE(is.is_open(), "open file: %s failed", file_path.c_str()); std::fpos pos; pos = is.tellg(); // save current position is.seekg(0, std::ios::end); is.seekg(pos); // restore saved position // 1. version uint32_t version; is.read(reinterpret_cast(&version), sizeof(version)); // 2 Lod information uint64_t lod_level; is.read(reinterpret_cast(&lod_level), sizeof(lod_level)); auto &lod = *tensor->mutable_lod(); lod.resize(lod_level); for (uint64_t i = 0; i < lod_level; ++i) { uint64_t size; is.read(reinterpret_cast(&size), sizeof(size)); std::vector tmp(size / sizeof(size_t)); is.read(reinterpret_cast(tmp.data()), static_cast(size)); for (auto j : tmp) { LOG(kLOG_DEBUG1) << " lod - " << j; } lod[i] = tmp; } // 3. tensor version uint32_t tensor_version; is.read(reinterpret_cast(&tensor_version), sizeof(tensor_version)); // 4. tensor desc int32_t size; is.read(reinterpret_cast(&size), sizeof(size)); std::unique_ptr buf(new char[size]); is.read(reinterpret_cast(buf.get()), size); const framework::TensorDesc &desc = var_desc.Tensor_desc(); PaddleMobile__Framework__Proto__VarType__TensorDesc *tensor_desc = NULL; // void *v; // PaddleMobile__Framework__Proto__VarType__TensorDesc_Closure()(tensor_desc, // buf.get()); // DLOG << "PaddleMobile__Framework__Proto__VarType__TensorDesc_Closure- " << // tensor_desc; // framework::TensorDesc &tensor_desc = variable-> // PaddleMobile__Framework__Proto__ProgramDesc *c_program; // uint8_t *proto_buf = NULL; // size_t read_size = ReadBuffer(file_path.c_str(), &proto_buf); // c_program = paddle_mobile__framework__proto__program_desc__unpack(NULL, // read_size, buf); // paddle_mobile__framework__proto__var_type__tensor_desc__init() int memory_size = 1; for (auto l : desc.Dims()) { memory_size *= l; } tensor->Resize(framework::make_ddim(desc.Dims())); void *memory = tensor; int type_size = 0; switch (desc.DataType()) { case framework::VARTYPE_TYPE_FP16: type_size = 2; break; case framework::VARTYPE_TYPE_FP32: type_size = 4; memory = tensor->mutable_data(); break; case framework::VARTYPE_TYPE_FP64: type_size = 8; break; case framework::VARTYPE_TYPE_INT32: type_size = 4; break; case framework::VARTYPE_TYPE_INT64: type_size = 8; break; case framework::VARTYPE_TYPE_BOOL: type_size = 1; break; default: break; } is.read(static_cast(memory), memory_size * type_size); is.close(); } template const framework::Program Loader::Load( const std::string &dirname, bool optimize) { std::string model_filename = dirname + "/__model__"; PaddleMobile__Framework__Proto__ProgramDesc *c_program; uint8_t *buf = NULL; size_t read_size = ReadBuffer(model_filename.c_str(), &buf); PADDLE_MOBILE_ENFORCE(buf != NULL, "read from __model__ is null"); c_program = paddle_mobile__framework__proto__program_desc__unpack( NULL, read_size, buf); // PADDLE_MOBILE_ENFORCE(c_program != NULL, "program is null"); // DLOG << "n_ops: " << (*c_program->blocks)->n_ops; // std::shared_ptr originProgramDesc = std::make_shared(c_program); framework::Program program; program.model_path = dirname; program.originProgram = originProgramDesc; std::shared_ptr scope = std::make_shared(); program.scope = scope; originProgramDesc->Block(0); for (const auto &block : originProgramDesc->Blocks()) { for (int i = 0; i < block->Vars().size(); ++i) { std::shared_ptr var_desc = block->Vars()[i]; // DLOG << "var name-- " << var_desc->Name(); auto var = scope->Var(var_desc->Name()); if (var_desc->Type() == framework::VARTYPE_TYPE_LOD_TENSOR) { if (var_desc->Persistable() && var_desc->Type() != framework::VARTYPE_TYPE_FEED_MINIBATCH && var_desc->Type() != framework::VARTYPE_TYPE_FETCH_LIST) { auto dim = var_desc->Tensor_desc().Dims(); auto tensor = var->GetMutable(); tensor->Resize(framework::make_ddim(dim)); } else { auto dim = var_desc->Tensor_desc().Dims(); PADDLE_MOBILE_ENFORCE(dim.size() > 0, "dim size is 0"); dim[0] = 1; auto tensor = var->GetMutable(); tensor->Resize(framework::make_ddim(dim)); } } else { // TODO(codeWorm): some. } } } // originProgramDesc->Description("program: "); if (optimize) { framework::ProgramOptimize program_optimize; program.optimizeProgram = program_optimize.FushionOptimize(originProgramDesc); } if (optimize) { program.optimizeProgram->Description("optimize: "); } else { originProgramDesc->Description("program: "); } paddle_mobile__framework__proto__program_desc__free_unpacked(c_program, NULL); return program; } template class Loader; #pragma mark - executor template Executor::Executor(const framework::Program p, int batch_size, bool use_optimize) : program_(p), batch_size_(batch_size), use_optimize_(use_optimize) { if (use_optimize_) { to_predict_program_ = program_.optimizeProgram; } else { to_predict_program_ = program_.originProgram; } Variable *variable_ptr = program_.scope->Var("batch_size"); variable_ptr[0].SetValue(batch_size); const std::vector> blocks = to_predict_program_->Blocks(); for (int i = 0; i < blocks.size(); ++i) { std::shared_ptr block_desc = blocks[i]; std::vector> ops = block_desc->Ops(); for (int j = 0; j < ops.size(); ++j) { std::shared_ptr op = ops[j]; DLOG << "create op: " << op->Type(); auto op_base = framework::OpRegistry::CreateOp( op->Type(), op->GetInputs(), op->GetOutputs(), op->GetAttrMap(), program_.scope); op_base->InferShape(); ops_of_block_[*block_desc.get()].push_back(op_base); } } InitMemory(); } template void Executor::LoadMemory(const framework::VarDesc var_desc, framework::LoDTensor *tensor, const std::string &file_path) { std::ifstream is(file_path); PADDLE_MOBILE_ENFORCE(is.is_open(), "open file: %s failed", file_path.c_str()); std::fpos pos; pos = is.tellg(); // save current position is.seekg(0, std::ios::end); is.seekg(pos); // restore saved position // 1. version uint32_t version; is.read(reinterpret_cast(&version), sizeof(version)); // 2 Lod information uint64_t lod_level; is.read(reinterpret_cast(&lod_level), sizeof(lod_level)); auto &lod = *tensor->mutable_lod(); lod.resize(lod_level); for (uint64_t i = 0; i < lod_level; ++i) { uint64_t size; is.read(reinterpret_cast(&size), sizeof(size)); std::vector tmp(size / sizeof(size_t)); is.read(reinterpret_cast(tmp.data()), static_cast(size)); for (auto j : tmp) { LOG(kLOG_DEBUG1) << " lod - " << j; } lod[i] = tmp; } // 3. tensor version uint32_t tensor_version; is.read(reinterpret_cast(&tensor_version), sizeof(tensor_version)); // 4. tensor desc int32_t size; is.read(reinterpret_cast(&size), sizeof(size)); std::unique_ptr buf(new char[size]); is.read(reinterpret_cast(buf.get()), size); const framework::TensorDesc &desc = var_desc.Tensor_desc(); int memory_size = 1; for (auto l : desc.Dims()) { memory_size *= l; } tensor->Resize(framework::make_ddim(desc.Dims())); void *memory = tensor; int type_size = 0; switch (desc.DataType()) { case framework::VARTYPE_TYPE_FP16: type_size = 2; break; case framework::VARTYPE_TYPE_FP32: type_size = 4; memory = tensor->mutable_data(); break; case framework::VARTYPE_TYPE_FP64: type_size = 8; break; case framework::VARTYPE_TYPE_INT32: type_size = 4; break; case framework::VARTYPE_TYPE_INT64: type_size = 8; break; case framework::VARTYPE_TYPE_BOOL: type_size = 1; break; default: break; } is.read(static_cast(memory), memory_size * type_size); is.close(); } template void Executor::InitMemory() { for (const auto &block : to_predict_program_->Blocks()) { for (const auto &var_desc : block->Vars()) { auto var = program_.scope->Var(var_desc->Name()); if (var_desc->Persistable()) { auto tensor = var->template GetMutable(); if (var_desc->Name() == "feed" || var_desc->Name() == "fetch") { continue; } LoadMemory(*var_desc, tensor, program_.model_path + "/" + var_desc->Name()); } else { if (var_desc->Type() == framework::VARTYPE_TYPE_LOD_TENSOR) { auto tensor = var->template GetMutable(); tensor->template mutable_data(); } } } } } template std::shared_ptr Executor::Predict( const framework::Tensor &t) { framework::Variable *g_feed_value = program_.scope->Var("feed"); framework::Tensor *feed_tensor = g_feed_value->GetMutable(); feed_tensor->Resize(t.dims()); feed_tensor->ShareDataWith(t); std::shared_ptr to_predict_block = to_predict_program_->Block(0); for (int j = 0; j < ops_of_block_[*to_predict_block.get()].size(); ++j) { auto op = ops_of_block_[*to_predict_block.get()][j]; op->Run(); } auto ops = ops_of_block_[*to_predict_program_->Block(0)]; auto last_op = ops.rbegin(); auto output_map = (*last_op)->Outputs(); std::vector out_keys = (*last_op)->GetOutKeys(); PADDLE_MOBILE_ENFORCE(out_keys.size() > 0, "the last op contains no output"); framework::LoDTensor *output_tensor = framework::GetVarValue(out_keys[0], output_map, *(program_.scope)); return std::shared_ptr(output_tensor); } template std::shared_ptr Executor::Predict( const framework::Tensor &t, int block_id) { return Predict(t); } template std::vector::Ptype> Executor::Predict( const std::vector &input, const std::vector &dims) { framework::Tensor tensor(input, framework::make_ddim(dims)); std::shared_ptr output_tensor = Predict(tensor, 0); Executor::Ptype *output_ptr = output_tensor->data::Ptype>(); std::vector::Ptype> result_vector; for (int j = 0; j < output_tensor->numel(); ++j) { result_vector.push_back(output_ptr[j]); } return result_vector; } template class Executor; } // namespace paddle_mobile