[Eager]release gil when run backward (#44433)

* release gil when run backward

[Eager]release gil when run backward (#44433)
* release gil when run backward
4e1f7692 · wanghuancoder · GitHub · 547075e9 · 4e1f7692 · 4e1f7692
3 changed file
--- a/paddle/fluid/eager/pylayer/py_layer_node.cc
+++ b/paddle/fluid/eager/pylayer/py_layer_node.cc
@@ -34,6 +34,7 @@ GradNodePyLayer::operator()(
                         kSlotSmallVectorSize>& grads,  // NOLINT
    bool create_graph,
    bool is_new_grad) {
+  pybind11::gil_scoped_acquire gil;
  VLOG(3) << "Running Eager Backward Node: " << name();
  paddle::small_vector<std::vector<paddle::experimental::Tensor>,

--- a/paddle/fluid/pybind/eager_functions.cc
+++ b/paddle/fluid/pybind/eager_functions.cc
@@ -119,9 +119,12 @@ static PyObject* eager_api_run_backward(PyObject* self,
  EAGER_TRY
  auto tensors = CastPyArg2VectorOfTensor(PyTuple_GET_ITEM(args, 0), 0);
  auto grad_tensors = CastPyArg2VectorOfTensor(PyTuple_GET_ITEM(args, 1), 1);
-  egr::Backward(tensors,
+  {
-                grad_tensors,
+    eager_gil_scoped_release guard;
-                CastPyArg2AttrBoolean(PyTuple_GET_ITEM(args, 2), 2));
+    egr::Backward(tensors,
+                  grad_tensors,
+                  CastPyArg2AttrBoolean(PyTuple_GET_ITEM(args, 2), 2));
+  }
  RETURN_PY_NONE
  EAGER_CATCH_AND_THROW_RETURN_NULL
 }
@@ -138,15 +141,18 @@ static PyObject* eager_api_run_partial_grad(PyObject* self,
  auto only_inputs = CastPyArg2AttrBoolean(PyTuple_GET_ITEM(args, 5), 5);
  auto allow_unused = CastPyArg2AttrBoolean(PyTuple_GET_ITEM(args, 6), 6);
  auto no_grad_vars = CastPyArg2VectorOfTensor(PyTuple_GET_ITEM(args, 7), 7);
+  std::vector<paddle::experimental::Tensor> result;
-  std::vector<paddle::experimental::Tensor> result = egr::Grad(tensors,
+  {
-                                                               inputs,
+    eager_gil_scoped_release guard;
-                                                               grad_tensors,
+    result = egr::Grad(tensors,
-                                                               retain_graph,
+                       inputs,
-                                                               create_graph,
+                       grad_tensors,
-                                                               only_inputs,
+                       retain_graph,
-                                                               allow_unused,
+                       create_graph,
-                                                               no_grad_vars);
+                       only_inputs,
+                       allow_unused,
+                       no_grad_vars);
+  }
  VLOG(1) << " in eager_api_run_partial_grad, after runing egr::Grad";
  return ToPyObject(result, true /* return_py_none_if_not_initialize */);
  EAGER_CATCH_AND_THROW_RETURN_NULL
@@ -179,18 +185,21 @@ static PyObject* eager_api_read_next_tensor_list(PyObject* self,
  auto tensor_base_list =
      CastPyArg2VectorOfTensorBase(PyTuple_GET_ITEM(args, 0), 0);
  std::vector<paddle::experimental::Tensor> tensor_list;
-  tensor_list.reserve(tensor_base_list.size());
+  {
-  auto func = [](framework::Tensor& tensor_base) {
+    eager_gil_scoped_release guard;
-    paddle::experimental::Tensor tensor(
+    tensor_list.reserve(tensor_base_list.size());
-        egr::Controller::Instance().GenerateUniqueName());
+    auto func = [](framework::Tensor& tensor_base) {
-    auto autograd_meta = egr::EagerUtils::autograd_meta(&tensor);
+      paddle::experimental::Tensor tensor(
-    autograd_meta->SetPersistable(false);
+          egr::Controller::Instance().GenerateUniqueName());
-    autograd_meta->SetStopGradient(true);
+      auto autograd_meta = egr::EagerUtils::autograd_meta(&tensor);
-    tensor.set_impl(std::make_shared<phi::DenseTensor>(tensor_base));
+      autograd_meta->SetPersistable(false);
-    return tensor;
+      autograd_meta->SetStopGradient(true);
-  };
+      tensor.set_impl(std::make_shared<phi::DenseTensor>(tensor_base));
-  for (auto& tensor_base : tensor_base_list) {
+      return tensor;
-    tensor_list.emplace_back(func(tensor_base));
+    };
+    for (auto& tensor_base : tensor_base_list) {
+      tensor_list.emplace_back(func(tensor_base));
+    }
  }
  return ToPyObject(tensor_list);
  EAGER_CATCH_AND_THROW_RETURN_NULL

--- a/paddle/fluid/pybind/eager_utils.h
+++ b/paddle/fluid/pybind/eager_utils.h
@@ -253,5 +253,17 @@ std::vector<paddle::framework::Scope*> GetScopePtrListFromArgs(
    ssize_t arg_idx,
    bool dispensable);
+class eager_gil_scoped_release {
+ public:
+  eager_gil_scoped_release() { tstate = PyEval_SaveThread(); }
+  ~eager_gil_scoped_release() {
+    if (!tstate) return;
+    PyEval_RestoreThread(tstate);
+  }
+ private:
+  PyThreadState* tstate{nullptr};
+};
 }  // namespace pybind
 }  // namespace paddle