Make all scope pointer to shared

681514e1 · minqiyang · ce24a920 · 681514e1 · 681514e1 · 681514e1
12 changed file
--- a/paddle/fluid/framework/details/fast_threaded_ssa_graph_executor.cc
+++ b/paddle/fluid/framework/details/fast_threaded_ssa_graph_executor.cc
@@ -22,7 +22,8 @@ namespace framework {
 namespace details {
 FastThreadedSSAGraphExecutor::FastThreadedSSAGraphExecutor(
-    const ExecutionStrategy &strategy, const std::vector<Scope *> &local_scopes,
+    const ExecutionStrategy &strategy,
+    const std::vector<std::shared_ptr<Scope>> &local_scopes,
    const std::vector<platform::Place> &places,
    std::unique_ptr<ir::Graph> &&graph)
    : strategy_(strategy),

--- a/paddle/fluid/framework/details/fast_threaded_ssa_graph_executor.h
+++ b/paddle/fluid/framework/details/fast_threaded_ssa_graph_executor.h
@@ -29,8 +29,9 @@ namespace details {
 class OpHandleBase;
 class FastThreadedSSAGraphExecutor : public SSAGraphExecutor {
 public:
-  FastThreadedSSAGraphExecutor(const ExecutionStrategy &strategy,
+  FastThreadedSSAGraphExecutor(
-                               const std::vector<Scope *> &local_scopes,
+      const ExecutionStrategy &strategy,
+      const std::vector<std::shared_ptr<Scope>> &local_scopes,
      const std::vector<platform::Place> &places,
      std::unique_ptr<ir::Graph> &&graph);
  FeedFetchList Run(const std::vector<std::string> &fetch_tensors) override;
@@ -38,7 +39,7 @@ class FastThreadedSSAGraphExecutor : public SSAGraphExecutor {
 private:
  ExecutionStrategy strategy_;
-  std::vector<Scope *> local_scopes_;
+  std::vector<std::shared_ptr<Scope>> local_scopes_;
  std::vector<platform::Place> places_;
  std::unique_ptr<ir::Graph> graph_;

--- a/paddle/fluid/framework/details/fetch_op_handle.cc
+++ b/paddle/fluid/framework/details/fetch_op_handle.cc
@@ -22,7 +22,7 @@ namespace framework {
 namespace details {
 FetchOpHandle::FetchOpHandle(ir::Node *node, FeedFetchList *data, size_t offset,
-                             std::vector<Scope *> *local_scopes)
+                             std::vector<std::shared_ptr<Scope>> *local_scopes)
    : OpHandleBase(node),
      data_(data),
      offset_(offset),

--- a/paddle/fluid/framework/details/fetch_op_handle.h
+++ b/paddle/fluid/framework/details/fetch_op_handle.h
@@ -29,7 +29,7 @@ namespace details {
 struct FetchOpHandle : public OpHandleBase {
 public:
  FetchOpHandle(ir::Node *node, FeedFetchList *data, size_t offset,
-                std::vector<Scope *> *local_scopes);
+                std::vector<std::shared_ptr<Scope>> *local_scopes);
  ~FetchOpHandle();
@@ -47,7 +47,7 @@ struct FetchOpHandle : public OpHandleBase {
 private:
  FeedFetchList *data_;
  size_t offset_;
-  std::vector<Scope *> *local_scopes_;
+  std::vector<std::shared_ptr<Scope>> *local_scopes_;
  std::vector<LoDTensor> tensors_;
 };

--- a/paddle/fluid/framework/details/scope_buffered_ssa_graph_executor.cc
+++ b/paddle/fluid/framework/details/scope_buffered_ssa_graph_executor.cc
@@ -23,7 +23,8 @@ namespace paddle {
 namespace framework {
 namespace details {
 ScopeBufferedSSAGraphExecutor::ScopeBufferedSSAGraphExecutor(
-    ExecutionStrategy strategy, std::vector<Scope *> local_scopes,
+    ExecutionStrategy strategy,
+    std::vector<std::shared_ptr<Scope>> local_scopes,
    std::vector<VariableInfo> var_infos, std::vector<platform::Place> places,
    std::unique_ptr<SSAGraphExecutor> &&underlying_executor)
    : strategy_(std::move(strategy)),

--- a/paddle/fluid/framework/details/scope_buffered_ssa_graph_executor.h
+++ b/paddle/fluid/framework/details/scope_buffered_ssa_graph_executor.h
@@ -37,7 +37,8 @@ struct VariableInfo {
 class ScopeBufferedSSAGraphExecutor : public SSAGraphExecutor {
 public:
  ScopeBufferedSSAGraphExecutor(
-      ExecutionStrategy strategy, std::vector<Scope*> local_scopes,
+      ExecutionStrategy strategy,
+      std::vector<std::shared_ptr<Scope>> local_scopes,
      std::vector<VariableInfo> var_infos, std::vector<platform::Place> places,
      std::unique_ptr<SSAGraphExecutor>&& underlying_executor);
@@ -52,7 +53,7 @@ class ScopeBufferedSSAGraphExecutor : public SSAGraphExecutor {
  ExecutionStrategy strategy_;
  std::unique_ptr<SSAGraphExecutor> underlying_executor_;
-  std::vector<Scope*> local_scopes_;
+  std::vector<std::shared_ptr<Scope>> local_scopes_;
  std::vector<VariableInfo> var_infos_;
  std::vector<platform::Place> places_;
 };

--- a/paddle/fluid/framework/details/threaded_ssa_graph_executor.cc
+++ b/paddle/fluid/framework/details/threaded_ssa_graph_executor.cc
@@ -21,7 +21,8 @@ namespace paddle {
 namespace framework {
 namespace details {
 ThreadedSSAGraphExecutor::ThreadedSSAGraphExecutor(
-    const ExecutionStrategy &strategy, const std::vector<Scope *> &local_scopes,
+    const ExecutionStrategy &strategy,
+    const std::vector<std::shared_ptr<Scope>> &local_scopes,
    const std::vector<platform::Place> &places,
    std::unique_ptr<ir::Graph> &&graph)
    : graph_(std::move(graph)),

--- a/paddle/fluid/framework/details/threaded_ssa_graph_executor.h
+++ b/paddle/fluid/framework/details/threaded_ssa_graph_executor.h
@@ -38,8 +38,9 @@ namespace details {
 class ThreadedSSAGraphExecutor : public SSAGraphExecutor {
 public:
-  ThreadedSSAGraphExecutor(const ExecutionStrategy &strategy,
+  ThreadedSSAGraphExecutor(
-                           const std::vector<Scope *> &local_scopes,
+      const ExecutionStrategy &strategy,
+      const std::vector<std::shared_ptr<Scope>> &local_scopes,
      const std::vector<platform::Place> &places,
      std::unique_ptr<ir::Graph> &&graph);
@@ -57,7 +58,7 @@ class ThreadedSSAGraphExecutor : public SSAGraphExecutor {
 private:
  std::unique_ptr<ir::Graph> graph_;
  std::unique_ptr<::ThreadPool> pool_;
-  std::vector<Scope *> local_scopes_;
+  std::vector<std::shared_ptr<Scope>> local_scopes_;
  std::vector<platform::Place> places_;
  platform::DeviceContextPool fetch_ctxs_;
  ExceptionHolder exception_holder_;

--- a/paddle/fluid/framework/parallel_executor.cc
+++ b/paddle/fluid/framework/parallel_executor.cc
@@ -39,7 +39,8 @@ std::unique_ptr<ir::Graph> ApplyParallelExecutorPass(
    const ProgramDesc &main_program, const std::vector<platform::Place> &places,
    const std::string &loss_var_name,
    const std::unordered_set<std::string> &param_names,
-    const std::vector<Scope *> &local_scopes, const bool use_cuda,
+    const std::vector<std::shared_ptr<Scope>> &local_scopes,
+    const bool use_cuda,
 #ifdef PADDLE_WITH_CUDA
    const BuildStrategy &strategy, platform::NCCLContextMap *nccl_ctxs) {
 #else
@@ -66,8 +67,8 @@ std::unique_ptr<ir::Graph> ApplyParallelExecutorPass(
                                                     &loss_var_name);
  multi_devices_pass->SetNotOwned<const std::unordered_set<std::string>>(
      "params", &param_names);
-  multi_devices_pass->SetNotOwned<const std::vector<Scope *>>("local_scopes",
+  multi_devices_pass->SetNotOwned<const std::vector<std::shared_ptr<Scope>>>(
-                                                              &local_scopes);
+      "local_scopes", &local_scopes);
  multi_devices_pass->SetNotOwned<const BuildStrategy>("strategy", &strategy);
 #ifdef PADDLE_WITH_CUDA
@@ -100,8 +101,8 @@ class ParallelExecutorPrivate {
      : places_(places) {}
  std::vector<platform::Place> places_;
-  std::vector<Scope *> local_scopes_;
+  std::vector<std::shared_ptr<Scope>> local_scopes_;
-  Scope *global_scope_;
+  std::shared_ptr<Scope> global_scope_;
  std::unique_ptr<details::SSAGraphExecutor> executor_;
 #ifdef PADDLE_WITH_CUDA
@@ -112,7 +113,7 @@ class ParallelExecutorPrivate {
  bool use_all_reduce_;
 };
-std::vector<Scope *> &ParallelExecutor::GetLocalScopes() {
+std::vector<std::shared_ptr<Scope>> &ParallelExecutor::GetLocalScopes() {
  return member_->local_scopes_;
 }
@@ -121,7 +122,8 @@ ParallelExecutor::ParallelExecutor(
    const std::unordered_set<std::string> &params,
    const std::unordered_set<std::string> &bcast_vars,
    const ProgramDesc &main_program, const std::string &loss_var_name,
-    Scope *scope, const std::vector<Scope *> &local_scopes,
+    const std::shared_ptr<Scope> &scope,
+    const std::vector<std::shared_ptr<Scope>> &local_scopes,
    const ExecutionStrategy &exec_strategy, const BuildStrategy &build_strategy,
    size_t num_trainers, size_t trainer_id)
    : member_(new ParallelExecutorPrivate(places)) {
@@ -142,13 +144,13 @@ ParallelExecutor::ParallelExecutor(
    member_->own_local_scope_ = true;
    member_->local_scopes_.emplace_back(member_->global_scope_);
    for (size_t i = 1; i < member_->places_.size(); ++i) {
-      member_->local_scopes_.emplace_back(&scope->NewScope());
+      member_->local_scopes_.emplace_back(scope->NewSharedScope());
    }
  } else {
    member_->own_local_scope_ = false;
    PADDLE_ENFORCE_EQ(member_->places_.size(), local_scopes.size());
    for (size_t i = 0; i < member_->places_.size(); ++i) {
-      member_->local_scopes_.emplace_back(&local_scopes[i]->NewScope());
+      member_->local_scopes_.emplace_back(local_scopes[i]->NewSharedScope());
    }
  }
@@ -321,7 +323,7 @@ void ParallelExecutor::FeedTensorsIntoLocalScopes(
  for (size_t i = 0; i < tensors.size(); ++i) {
    auto &map = tensors[i];
-    auto *scope = member_->local_scopes_[i];
+    auto &scope = member_->local_scopes_[i];
    for (auto &pair : map) {
      auto *trg = scope->Var(pair.first)->GetMutable<LoDTensor>();
      trg->ShareDataWith(pair.second);
@@ -351,8 +353,15 @@ void ParallelExecutor::FeedAndSplitTensorIntoLocalScopes(
 ParallelExecutor::~ParallelExecutor() {
  if (member_->own_local_scope_) {
+    std::vector<Scope *> local_scopes_ptrs;
+    local_scopes_ptrs.reserve(member_->local_scopes_.size());
    for (size_t i = 1; i < member_->local_scopes_.size(); ++i) {
-      member_->global_scope_->DeleteScope(member_->local_scopes_[i]);
+      local_scopes_ptrs.emplace_back(member_->local_scopes_[i].get());
+      member_->local_scopes_[i].reset();
+    }
+    for (size_t i = 0; i != local_scopes_ptrs.size(); ++i) {
+      member_->global_scope_->DeleteScope(local_scopes_ptrs[i]);
    }
  }
 }

--- a/paddle/fluid/framework/parallel_executor.h
+++ b/paddle/fluid/framework/parallel_executor.h
@@ -39,19 +39,20 @@ class ParallelExecutor {
  DISABLE_COPY_AND_ASSIGN(ParallelExecutor);
 public:
-  explicit ParallelExecutor(const std::vector<platform::Place> &places,
+  explicit ParallelExecutor(
+      const std::vector<platform::Place> &places,
      const std::unordered_set<std::string> &params,
      const std::unordered_set<std::string> &bcast_vars,
-                            const ProgramDesc &main_program,
+      const ProgramDesc &main_program, const std::string &loss_var_name,
-                            const std::string &loss_var_name, Scope *scope,
+      const std::shared_ptr<Scope> &scope,
-                            const std::vector<Scope *> &local_scopes,
+      const std::vector<std::shared_ptr<Scope>> &local_scopes,
      const ExecutionStrategy &exec_strategy,
-                            const BuildStrategy &build_strategy,
+      const BuildStrategy &build_strategy, size_t num_trainers = 1,
-                            size_t num_trainers = 1, size_t trainer_id = 0);
+      size_t trainer_id = 0);
  ~ParallelExecutor();
-  std::vector<Scope *> &GetLocalScopes();
+  std::vector<std::shared_ptr<Scope>> &GetLocalScopes();
  /**
   * Feed tensors to local scopes. The size of tensors should be equal to the

--- a/paddle/fluid/framework/scope.cc
+++ b/paddle/fluid/framework/scope.cc
@@ -38,8 +38,8 @@ Scope::~Scope() { DropKids(); }
 Scope& Scope::NewScope() const {
  std::unique_lock<std::mutex> lock(mutex_);
-  kids_.push_back(new Scope(this));
+  kids_.push_back(std::shared_ptr<Scope>(new Scope(this)));
-  return *kids_.back();
+  return kids_.back().get();
 }
 Variable* Scope::Var(const std::string& name) {
@@ -68,7 +68,6 @@ const Scope* Scope::FindScope(const Variable* var) const {
 void Scope::DropKids() {
  std::unique_lock<std::mutex> lock(mutex_);
-  for (Scope* s : kids_) delete s;
  kids_.clear();
 }
@@ -84,8 +83,12 @@ std::vector<std::string> Scope::LocalVarNames() const {
 void Scope::DeleteScope(Scope* scope) const {
  std::unique_lock<std::mutex> lock(mutex_);
-  auto it = std::find(this->kids_.begin(), this->kids_.end(), scope);
+  auto it = std::find_if(this->kids_.begin(), this->kids_.end(),
+                         [&scope](const std::shared_ptr<Scope>& kid) {
+                           return kid.get() == scope;
+                         });
  PADDLE_ENFORCE(it != this->kids_.end(), "Cannot find %p as kid scope", scope);
+  it->reset();
  this->kids_.erase(it);
  // When making memory benchmark on Fluid, we have to delete scope sync.
  if (FLAGS_benchmark || FLAGS_eager_delete_scope) {

--- a/paddle/fluid/framework/scope.h
+++ b/paddle/fluid/framework/scope.h
@@ -105,7 +105,7 @@ class Scope {
  Variable* FindVarLocally(const std::string& name) const;
  // Scope in `kids_` are owned by this class.
-  mutable std::list<Scope*> kids_;
+  mutable std::list<std::shared_ptr<Scope>> kids_;
  Scope const* parent_{nullptr};
  DISABLE_COPY_AND_ASSIGN(Scope);