polish and resolve conflicts

test=develop

polish and resolve conflicts
test=develop
8ae9094e · Xin Pan · beaae61a · 8ae9094e · 8ae9094e
隐藏空白更改
内联并排

Showing with 7 addition and 6 deletion

paddle/fluid/framework/parallel_executor.cc paddle/fluid/framework/parallel_executor.cc +1 -1

python/paddle/fluid/executor.py python/paddle/fluid/executor.py +6 -5

未找到文件。
--- a/paddle/fluid/framework/parallel_executor.cc
+++ b/paddle/fluid/framework/parallel_executor.cc
@@ -200,7 +200,7 @@ ParallelExecutor::ParallelExecutor(
  member_->build_strategy_ = build_strategy;
  member_->use_all_reduce_ =
      build_strategy.reduce_ == BuildStrategy::ReduceStrategy::kAllReduce;
-  member_->nranks_ = num_trainers * places.size();
+  member_->nranks_ = build_strategy.num_trainers_ * places.size();
  if (!member_->use_all_reduce_) {
    PADDLE_ENFORCE(places.size() > 1,

--- a/python/paddle/fluid/executor.py
+++ b/python/paddle/fluid/executor.py
@@ -375,7 +375,6 @@ class Executor(object):
            self._closed = True
    def _run_parallel(self,
-                      exe,
                      scope,
                      feed=None,
                      fetch_list=None,
@@ -391,7 +390,8 @@ class Executor(object):
                    feed_tensor.set(feed[feed_name], core.CPUPlace())
                feed_tensor_dict[feed_name] = feed_tensor
-            exe.feed_and_split_tensor_into_local_scopes(feed_tensor_dict)
+            self.executor.feed_and_split_tensor_into_local_scopes(
+                feed_tensor_dict)
        elif isinstance(feed, list) or isinstance(feed, tuple):
            if len(feed) != len(self._places):
                raise ValueError(
@@ -412,10 +412,10 @@ class Executor(object):
                        tensor = tmp
                    res_dict[feed_name] = tensor
                res.append(res_dict)
-            exe.feed_tensors_into_local_scopes(res)
+            self.executor.feed_tensors_into_local_scopes(res)
        fetch_var_name = '@FETCHED_VAR_NAME@'
-        exe.run(fetch_list, fetch_var_name)
+        self.executor.run(fetch_list, fetch_var_name)
        arr = scope.find_var(fetch_var_name).get_lod_tensor_array()
        if return_numpy:
@@ -502,12 +502,13 @@ class Executor(object):
        self.executor = program._executor
        if program._is_data_parallel:
            return self._run_parallel(
-                exe=program._executor,
                scope=scope,
                feed=feed,
                fetch_list=fetch_list,
                return_numpy=return_numpy)
        else:
+            # TODO(panyx0718): Can compile program to optimize executor
+            # performance.
            return self._run(
                program._program,
                feed=feed,