executor_test.cc 11.5 KB
Newer Older
Q
qijun 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.

Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License. */

#include "paddle/framework/executor.h"
Y
Yang Yang 已提交
16 17

#include <memory>
Q
qijun 已提交
18
#include <vector>
Y
Yang Yang 已提交
19

Y
Yu Yang 已提交
20
#include "gflags/gflags.h"
Y
Yang Yang 已提交
21
#include "gtest/gtest.h"
Y
Yang Yang 已提交
22
#include "paddle/framework/attribute.h"
Y
Yang Yang 已提交
23
#include "paddle/framework/backward.h"
Y
Yang Yang 已提交
24 25
#include "paddle/framework/block_desc.h"
#include "paddle/framework/op_desc.h"
Y
Yang Yang 已提交
26 27 28
#include "paddle/framework/op_registry.h"
#include "paddle/framework/operator.h"

Q
qijun 已提交
29 30 31 32 33 34 35 36
USE_OP(elementwise_add);
USE_OP(gaussian_random);
USE_OP(feed);
USE_OP(fetch);
USE_OP(mul);
USE_OP(sum);
USE_OP(squared_l2_distance);
USE_OP(fill_constant);
37
USE_OP(mean);
Q
qijun 已提交
38 39
USE_OP(sgd);

Q
qijun 已提交
40 41 42
using namespace paddle::platform;
using namespace paddle::framework;

Y
Yang Yang 已提交
43 44
void AddOp(const std::string& type, const VariableNameMap& inputs,
           const VariableNameMap& outputs, AttributeMap attrs,
Y
Yang Yang 已提交
45
           paddle::framework::BlockDescBind* block) {
Y
Yang Yang 已提交
46 47 48
  // insert output
  for (auto kv : outputs) {
    for (auto v : kv.second) {
49 50 51 52 53
      // <<<<<<< HEAD
      //       auto var = block->Var(v);
      //       var->SetType(VarDesc::LOD_TENSOR);
      //       var->SetDataType(paddle::framework::DataType::FP32);
      // =======
54
      if (!block->HasVar(v)) {
55
        auto var = block->Var(v);
56 57
        var->SetDataType(paddle::framework::DataType::FP32);
      }
58
      // >>>>>>> origin/develop
Y
Yang Yang 已提交
59 60 61 62
    }
  }

  // insert op
Y
Yang Yang 已提交
63 64
  auto op = block->AppendOp();
  op->SetType(type);
Y
Yang Yang 已提交
65
  for (auto& kv : inputs) {
Y
Yang Yang 已提交
66
    op->SetInput(kv.first, kv.second);
Y
Yang Yang 已提交
67
  }
Y
Yang Yang 已提交
68
  for (auto& kv : outputs) {
Y
Yang Yang 已提交
69
    op->SetOutput(kv.first, kv.second);
Y
Yang Yang 已提交
70
  }
Y
Yang Yang 已提交
71
  op->SetAttrMap(attrs);
72
  op->CheckAttrs();
Y
Yang Yang 已提交
73 74
}

Y
Yang Yang 已提交
75
// Tensors in feed value variable will only be in CPUPlace
Q
qijun 已提交
76
// So we can memcpy the data from vector<T> to feed_value
Q
qijun 已提交
77
template <typename T>
Y
Yang Yang 已提交
78 79
void SetFeedVariable(const std::vector<std::vector<T>>& inputs,
                     const std::vector<std::vector<int64_t>>& dims) {
Q
qijun 已提交
80
  Variable* g_feed_value = GetGlobalScope().FindVar("feed_value");
Q
qijun 已提交
81 82
  auto& feed_inputs =
      *(g_feed_value->GetMutable<std::vector<paddle::framework::Tensor>>());
Y
Yang Yang 已提交
83
  size_t size = inputs.size();
84
  feed_inputs.resize(size);
Q
qijun 已提交
85
  for (size_t i = 0; i < size; i++) {
Y
Yang Yang 已提交
86
    T* dst = feed_inputs[i].mutable_data<T>(make_ddim(dims[i]), CPUPlace());
87
    memcpy(dst, inputs[i].data(), inputs[i].size() * sizeof(T));
Q
qijun 已提交
88 89 90
  }
}

Y
Yang Yang 已提交
91 92
// Tensors in fetch value variable will only be in CPUPlace
// So we can memcpy the data from fetch_value to vector<T>
Q
qijun 已提交
93
template <typename T>
Y
Yang Yang 已提交
94
std::vector<std::vector<T>> GetFetchVariable() {
Q
qijun 已提交
95
  Variable* g_fetch_value = GetGlobalScope().FindVar("fetch_value");
Q
qijun 已提交
96 97
  auto& fetch_outputs =
      *(g_fetch_value->GetMutable<std::vector<paddle::framework::Tensor>>());
Q
qijun 已提交
98

Y
Yang Yang 已提交
99
  size_t size = fetch_outputs.size();
Q
qijun 已提交
100 101 102 103
  std::vector<std::vector<T>> result;
  result.reserve(size);
  for (size_t i = 0; i < size; i++) {
    std::vector<T> tmp;
104
    tmp.resize(fetch_outputs[i].numel());
Q
qijun 已提交
105 106 107 108
    memcpy(tmp.data(), fetch_outputs[i].data<T>(),
           fetch_outputs[i].numel() * sizeof(T));
    result.push_back(tmp);
  }
Y
Yang Yang 已提交
109

Q
qijun 已提交
110 111 112
  return result;
}

Q
qijun 已提交
113
class ExecutorTesterRandom : public ::testing::Test {
Q
qijun 已提交
114 115
 public:
  virtual void SetUp() override {
Y
Yang Yang 已提交
116
    int input_dim = 3, batch_size = 2, embed_dim = 5;
Y
Yang Yang 已提交
117

Y
Yang Yang 已提交
118 119 120 121 122 123
    auto temp_init_root_block = init_pdesc_.add_blocks();
    temp_init_root_block->set_idx(0);
    temp_init_root_block->set_parent_idx(-1);
    paddle::framework::ProgramDescBind& init_program =
        paddle::framework::ProgramDescBind::Instance(&init_pdesc_);
    paddle::framework::BlockDescBind* init_root_block = init_program.Block(0);
Y
Yang Yang 已提交
124

Y
Yang Yang 已提交
125
    AddOp("gaussian_random", {}, {{"Out", {"w1"}}},
Y
Yang Yang 已提交
126
          {{"dims", std::vector<int>{input_dim, embed_dim}}}, init_root_block);
Y
Yang Yang 已提交
127
    AddOp("gaussian_random", {}, {{"Out", {"w2"}}},
Y
Yang Yang 已提交
128
          {{"dims", std::vector<int>{embed_dim, input_dim}}}, init_root_block);
129 130
    AddOp("fetch", {{"Input", {"w1"}}}, {}, {{"col", 0}}, init_root_block);
    AddOp("fetch", {{"Input", {"w2"}}}, {}, {{"col", 1}}, init_root_block);
Y
Yang Yang 已提交
131 132 133 134

    // flush
    init_program.Proto();

Y
Yang Yang 已提交
135
    // run block
Y
Yang Yang 已提交
136 137 138 139 140 141
    auto temp_root_block = pdesc_.add_blocks();
    temp_root_block->set_idx(0);
    temp_root_block->set_parent_idx(-1);
    paddle::framework::ProgramDescBind& program =
        paddle::framework::ProgramDescBind::Instance(&pdesc_);
    paddle::framework::BlockDescBind* root_block = program.Block(0);
Q
qijun 已提交
142

Y
Yang Yang 已提交
143
    // feed data
Y
Yang Yang 已提交
144
    inputs_.push_back({1.0, 1.0, 1.0, 1.0, 1.0, 1.0});
Y
Yang Yang 已提交
145 146 147 148 149
    dims_.push_back({batch_size, input_dim});
    AddOp("feed", {}, {{"Out", {"a"}}},
          {{"dims", std::vector<int>{batch_size, input_dim}}, {"col", 0}},
          root_block);

Y
Yang Yang 已提交
150
    // forward
Y
Yang Yang 已提交
151
    AddOp("mul", {{"X", {"a"}}, {"Y", {"w1"}}}, {{"Out", {"b"}}}, {},
Y
Yang Yang 已提交
152
          root_block);
Y
Yang Yang 已提交
153
    AddOp("mul", {{"X", {"b"}}, {"Y", {"w2"}}}, {{"Out", {"a_out"}}}, {},
Y
Yang Yang 已提交
154
          root_block);
Y
Yang Yang 已提交
155 156
    AddOp("squared_l2_distance", {{"X", {"a"}}, {"Y", {"a_out"}}},
          {{"Out", {"l2_distance"}}, {"sub_result", {"l2_distance_sub"}}}, {},
Y
Yang Yang 已提交
157
          root_block);
158 159
    AddOp("mean", {{"X", {"l2_distance"}}}, {{"Out", {"mean_out"}}}, {},
          root_block);
Y
Yang Yang 已提交
160

Y
Yang Yang 已提交
161
    // backward
162 163
    auto target = VarDescBind("mean_out");
    AppendBackward(program, target, {});
Y
Yang Yang 已提交
164 165 166

    // update
    AddOp("fill_constant", {}, {{"Out", {"learning_rate"}}},
Y
Yang Yang 已提交
167 168
          {{"shape", std::vector<int>{1}}, {"value", float(0.001)}},
          root_block);
Y
Yang Yang 已提交
169 170 171 172 173 174 175 176 177
    AddOp("sgd", {{"Param", {"w1"}},
                  {"LearningRate", {"learning_rate"}},
                  {"Grad", {"w1@GRAD"}}},
          {{"ParamOut", {"w1"}}}, {}, root_block);
    AddOp("sgd", {{"Param", {"w2"}},
                  {"LearningRate", {"learning_rate"}},
                  {"Grad", {"w2@GRAD"}}},
          {{"ParamOut", {"w2"}}}, {}, root_block);

178 179
    AddOp("fetch", {{"Input", {"w1"}}}, {}, {{"col", 0}}, root_block);
    AddOp("fetch", {{"Input", {"w2"}}}, {}, {{"col", 1}}, root_block);
Y
Yang Yang 已提交
180
    AddOp("fetch", {{"Input", {"l2_distance"}}}, {}, {{"col", 0}}, root_block);
Y
Yang Yang 已提交
181

Y
Yang Yang 已提交
182 183
    // flush
    program.Proto();
Q
qijun 已提交
184
  }
Y
Yang Yang 已提交
185

Q
qijun 已提交
186
 protected:
Y
Yang Yang 已提交
187
  ProgramDesc init_pdesc_;
Q
qijun 已提交
188
  ProgramDesc pdesc_;
Y
Yang Yang 已提交
189 190
  std::vector<std::vector<float>> inputs_;
  std::vector<std::vector<int64_t>> dims_;
Q
qijun 已提交
191 192
};

Y
Yang Yang 已提交
193
class ExecutorTesterFeedAndFetch : public ::testing::Test {
Q
qijun 已提交
194 195
 public:
  virtual void SetUp() override {
Y
Yang Yang 已提交
196 197 198 199 200 201 202 203
    auto temp_root_block = pdesc_.add_blocks();
    temp_root_block->set_idx(0);
    temp_root_block->set_parent_idx(-1);

    // wrap to BlockDescBind
    paddle::framework::ProgramDescBind& program =
        paddle::framework::ProgramDescBind::Instance(&pdesc_);
    paddle::framework::BlockDescBind* root_block = program.Block(0);
Q
qijun 已提交
204

205 206
    std::vector<int> dim{6};

Y
Yang Yang 已提交
207 208 209 210
    AddOp("feed", {}, {{"Out", {"a"}}}, {{"dims", dim}, {"col", 0}},
          root_block);
    AddOp("feed", {}, {{"Out", {"b"}}}, {{"dims", dim}, {"col", 1}},
          root_block);
211 212
    AddOp("fetch", {{"Input", {"a"}}}, {}, {{"col", 0}}, root_block);
    AddOp("fetch", {{"Input", {"b"}}}, {}, {{"col", 1}}, root_block);
Q
qijun 已提交
213

Y
Yang Yang 已提交
214 215 216
    // flush
    program.Proto();

217 218
    std::vector<float> vec1 = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0};
    std::vector<float> vec2 = {4.0, 5.0, 6.0, 7.0, 8.0, 9.0};
Q
qijun 已提交
219 220
    inputs_.push_back(vec1);
    inputs_.push_back(vec2);
Y
Yang Yang 已提交
221 222
    dims_.push_back({static_cast<int64_t>(vec1.size())});
    dims_.push_back({static_cast<int64_t>(vec2.size())});
Q
qijun 已提交
223 224 225 226 227
  }

 protected:
  ProgramDesc pdesc_;
  std::vector<std::vector<float>> inputs_;
Y
Yang Yang 已提交
228
  std::vector<std::vector<int64_t>> dims_;
Q
qijun 已提交
229 230
};

Q
qijun 已提交
231
#ifndef PADDLE_WITH_CUDA
Q
qijun 已提交
232
TEST_F(ExecutorTesterRandom, CPU) {
Q
qijun 已提交
233
  std::vector<Place> places;
234 235 236 237 238 239 240 241
  CPUPlace cpu_place;
  places.push_back(cpu_place);

  // We have a global Scope and BuddyAllocator, and we must ensure
  // global BuddyAllocator is initialized before global Scope. Thus,
  // global Scope will deconstruct before BuddyAllocator. Otherwise,
  // "pointer being freed was not allocated" error will appear.
  paddle::memory::Used(cpu_place);
Q
qijun 已提交
242

Y
Yang Yang 已提交
243 244
  std::unique_ptr<Executor> executor(new Executor(places));

Q
qijun 已提交
245 246 247
  executor->Run(init_pdesc_, &GetGlobalScope(), 0);
  SetFeedVariable<float>(inputs_, dims_);
  executor->Run(pdesc_, &GetGlobalScope(), 0);
Y
Yang Yang 已提交
248
  std::vector<std::vector<float>> result = GetFetchVariable<float>();
Q
qijun 已提交
249 250
}

Y
Yang Yang 已提交
251
TEST_F(ExecutorTesterFeedAndFetch, CPU) {
Q
qijun 已提交
252 253 254 255
  std::vector<Place> places;
  CPUPlace cpu_place;
  places.push_back(cpu_place);

256 257 258 259 260 261
  // We have a global Scope and BuddyAllocator, and we must ensure
  // global BuddyAllocator is initialized before global Scope. Thus,
  // global Scope will deconstruct before BuddyAllocator. Otherwise,
  // "pointer being freed was not allocated" error will appear.
  paddle::memory::Used(cpu_place);

Y
Yang Yang 已提交
262
  std::unique_ptr<Executor> executor(new Executor(places));
Q
qijun 已提交
263

Y
Yang Yang 已提交
264
  for (int batch_id = 0; batch_id < 3; batch_id++) {
Y
Yang Yang 已提交
265
    SetFeedVariable<float>(inputs_, dims_);
Q
qijun 已提交
266
    executor->Run(pdesc_, &GetGlobalScope(), 0);
Y
Yang Yang 已提交
267
    std::vector<std::vector<float>> result = GetFetchVariable<float>();
Y
Yang Yang 已提交
268 269 270 271 272
    PADDLE_ENFORCE_EQ(result.size(), inputs_.size());
    for (size_t i = 0; i < result.size(); ++i) {
      PADDLE_ENFORCE_EQ(result[i].size(), inputs_[i].size());
      for (size_t j = 0; j < result[i].size(); ++j) {
        PADDLE_ENFORCE_EQ(result[i][j], inputs_[i][j]);
Q
qijun 已提交
273 274
      }
    }
Q
qijun 已提交
275
  }
Q
qijun 已提交
276
}
Q
qijun 已提交
277
#else
Q
qijun 已提交
278 279 280 281 282
TEST_F(ExecutorTesterRandom, GPU) {
  std::vector<Place> places;
  GPUPlace gpu_place(0);
  places.push_back(gpu_place);

Q
qijun 已提交
283 284 285 286 287 288 289
  // We have a global Scope and BuddyAllocator, and we must ensure
  // global BuddyAllocator is initialized before global Scope. Thus,
  // global Scope will deconstruct before BuddyAllocator. Otherwise,
  // "pointer being freed was not allocated" error will appear.
  // If paddle is compiled with GPU, both CPU and GPU BuddyAllocator
  // need to be used at first.
  paddle::memory::Used(CPUPlace());
290 291
  paddle::memory::Used(gpu_place);

Y
Yang Yang 已提交
292
  std::unique_ptr<Executor> executor(new Executor(places));
Y
Yang Yang 已提交
293

Q
qijun 已提交
294
  executor->Run(init_pdesc_, &GetGlobalScope(), 0);
Y
Yang Yang 已提交
295
  for (int batch_id = 0; batch_id < 3; batch_id++) {
Y
Yang Yang 已提交
296
    SetFeedVariable<float>(inputs_, dims_);
Q
qijun 已提交
297
    executor->Run(pdesc_, &GetGlobalScope(), 0);
Y
Yang Yang 已提交
298
  }
Q
qijun 已提交
299 300
}

Y
Yang Yang 已提交
301
TEST_F(ExecutorTesterFeedAndFetch, GPU) {
Q
qijun 已提交
302
  std::vector<Place> places;
Q
qijun 已提交
303 304
  GPUPlace gpu_place(0);
  places.push_back(gpu_place);
Q
qijun 已提交
305 306 307 308 309 310 311
  // We have a global Scope and BuddyAllocator, and we must ensure
  // global BuddyAllocator is initialized before global Scope. Thus,
  // global Scope will deconstruct before BuddyAllocator. Otherwise,
  // "pointer being freed was not allocated" error will appear.
  // If paddle is compiled with GPU, both CPU and GPU BuddyAllocator
  // need to be used at first.
  paddle::memory::Used(CPUPlace());
312 313
  paddle::memory::Used(gpu_place);

Y
Yang Yang 已提交
314
  std::unique_ptr<Executor> executor(new Executor(places));
Q
qijun 已提交
315

Y
Yang Yang 已提交
316
  for (int batch_id = 0; batch_id < 3; batch_id++) {
Y
Yang Yang 已提交
317
    SetFeedVariable<float>(inputs_, dims_);
Q
qijun 已提交
318
    executor->Run(pdesc_, &GetGlobalScope(), 0);
Y
Yang Yang 已提交
319
    std::vector<std::vector<float>> result = GetFetchVariable<float>();
Y
Yang Yang 已提交
320 321 322 323 324
    PADDLE_ENFORCE_EQ(result.size(), inputs_.size());
    for (size_t i = 0; i < result.size(); ++i) {
      PADDLE_ENFORCE_EQ(result[i].size(), inputs_[i].size());
      for (size_t j = 0; j < result[i].size(); ++j) {
        PADDLE_ENFORCE_EQ(result[i][j], inputs_[i][j]);
Q
qijun 已提交
325 326 327
      }
    }
  }
Y
Yang Yang 已提交
328
}
Y
Yu Yang 已提交
329 330 331 332 333 334 335 336

DECLARE_double(fraction_of_gpu_memory_to_use);

int main(int argc, char** argv) {
  testing::InitGoogleTest(&argc, argv);
  // Use less GPU memory for unittest.
  FLAGS_fraction_of_gpu_memory_to_use = 0.25;
  return RUN_ALL_TESTS();
Y
Yu Yang 已提交
337 338
}

Q
qijun 已提交
339
#endif