[Eager] use eager final state instead intermediate state (#44722)

* [Eager] call final_state_slice under eager mode * rm useless comments * use eager final state instead intermidiate state * update fill_constant yaml * update fill_constant yaml * modify wrapped_infermeta_gen logic to fix special case * fix slice in manipulation * use fill_constant_ * modify slice infermeta * rm final_state_conv2d * use final_state_slice * use final_state_slice only * polish slice, use final state * add paddle_throw for SplitInferMeta * rm fill_constant_ temply * recover array_equal, not allclose * recover original code

[Eager] use eager final state instead intermediate state (#44722)
* [Eager] call final_state_slice under eager mode * rm useless comments * use eager final state instead intermidiate state * update fill_constant yaml * update fill_constant yaml * modify wrapped_infermeta_gen logic to fix special case * fix slice in manipulation * use fill_constant_ * modify slice infermeta * rm final_state_conv2d * use final_state_slice * use final_state_slice only * polish slice, use final state * add paddle_throw for SplitInferMeta * rm fill_constant_ temply * recover array_equal, not allclose * recover original code
f1873b90 · Weilong Wu · GitHub · 2cf2e786 · f1873b90 · f1873b90
11 changed file
--- a/paddle/fluid/pybind/eager_method.cc
+++ b/paddle/fluid/pybind/eager_method.cc
@@ -825,8 +825,7 @@ static PyObject* tensor__getitem_index_not_tensor(TensorObject* self,
      }
      paddle::experimental::Tensor new_out;
-      framework::AttributeMap attrs = {{"axes", none_axes}};
+      new_out = unsqueeze_final_state_dygraph_function(out, none_axes);
-      new_out = std::get<0>(unsqueeze2_dygraph_function(out, std::move(attrs)));
      return ToPyObject(new_out);
    }
  }

--- a/paddle/phi/api/yaml/legacy_api.yaml
+++ b/paddle/phi/api/yaml/legacy_api.yaml
--- a/paddle/phi/infermeta/unary.cc
+++ b/paddle/phi/infermeta/unary.cc
@@ -2614,16 +2614,22 @@ void SliceRawInferMeta(const MetaTensor& input,
    // To be compatible with other op tests in which infer_flags is not set.
    infer_flags = std::vector<int64_t>(axes.size(), 1);
  }
+  auto new_axes = axes;
+  for (auto& axis : new_axes) {
+    if (axis < 0) {
+      axis = std::max(int64_t(0), axis + int64_t(in_dims.size()));
+    }
+  }
  // 2.1 Check attrs.
  std::vector<int64_t> starts = starts_arr.GetData();
  std::vector<int64_t> ends = ends_arr.GetData();
  phi::funcs::CheckAndUpdateSliceAttrs<int64_t>(
-      in_dims, axes, &starts, &ends, nullptr, &infer_flags);
+      in_dims, new_axes, &starts, &ends, nullptr, &infer_flags);
  auto slice_dims = phi::funcs::GetSliceDims<int64_t>(
-      in_dims, axes, starts, ends, nullptr, &infer_flags);
+      in_dims, new_axes, starts, ends, nullptr, &infer_flags);
  if (config.is_runtime) {
    out_dims = phi::funcs::GetDecreasedDims<int64_t>(
        slice_dims, decrease_axis, &infer_flags);
@@ -2633,7 +2639,7 @@ void SliceRawInferMeta(const MetaTensor& input,
  }
  out->set_dims(out_dims);
-  if (axes.size() > 0 && axes[0] != 0) {
+  if (new_axes.size() > 0 && new_axes[0] != 0) {
    out->share_lod(input);
  }
 }
@@ -2662,6 +2668,13 @@ void SplitInferMeta(const MetaTensor& x,
                    const Scalar& axis,
                    std::vector<MetaTensor*> out,
                    MetaConfig config) {
+  if (axis.dtype() == DataType::FLOAT32 || axis.dtype() == DataType::FLOAT64) {
+    PADDLE_THROW(
+        phi::errors::InvalidArgument("%s(): argument (position 3) must be "
+                                     "int, but got %s",
+                                     "split",
+                                     "float"));  // NOLINT
+  }
  int axis_value = axis.to<int>();
  int rank = x.dims().size();
  PADDLE_ENFORCE_EQ(

--- a/python/paddle/fluid/dygraph/math_op_patch.py
+++ b/python/paddle/fluid/dygraph/math_op_patch.py
@@ -290,6 +290,8 @@ def monkey_patch_math_varbase():
            axis = -1
            math_op = getattr(_C_ops, op_type)
            if call_final_api:
+                if op_type == "final_state_matmul":
+                    return math_op(self, other_var, False, False)
                return math_op(self, other_var, -1)
            return math_op(self, other_var, 'axis', axis)
@@ -385,10 +387,16 @@ def monkey_patch_math_varbase():
                                      None)),
        ('__floordiv__',
         _binary_creator_('__floordiv__', 'elementwise_floordiv', False, None)),
-        ('__mod__', _binary_creator_('__mod__', 'elementwise_mod', False,
+        ('__mod__',
-                                     None)),
+         _binary_creator_('__mod__', 'final_state_modulo', False, None, True))
-        ('__matmul__', _binary_creator_('__matmul__', "matmul_v2", False,
+        if framework._in_eager_mode_ else
-                                        None)),
+        ('__mod__',
+         _binary_creator_('__mod__', 'elementwise_mod', False, None)),
+        ('__matmul__',
+         _binary_creator_('__matmul__', "final_state_matmul", False, None,
+                          True)) if framework._in_eager_mode_ else
+        ('__matmul__',
+         _binary_creator_('__matmul__', "matmul_v2", False, None)),
        ## for logical compare
        ('__eq__',
         _binary_creator_('__eq__', 'final_state_equal', False, None, True))

--- a/python/paddle/fluid/initializer.py
+++ b/python/paddle/fluid/initializer.py
@@ -23,6 +23,7 @@ from .core import VarDesc
 from . import unique_name
 from .data_feeder import check_variable_and_dtype, check_type, check_dtype
 from paddle import _C_ops
+import paddle
 __all__ = [
    'Constant', 'Uniform', 'Normal', 'TruncatedNormal', 'Xavier', 'Bilinear',
@@ -599,9 +600,15 @@ class XavierInitializer(Initializer):
        if framework._non_static_mode():
            if self._uniform:
                limit = math.sqrt(6.0 / float(fan_in + fan_out))
-                out_var = _C_ops.uniform_random('shape', out_var.shape, 'min',
+                if in_dygraph_mode():
-                                                -limit, 'max', limit, 'seed',
+                    out_var = _C_ops.final_state_uniform_random(
-                                                self._seed, 'dtype', out_dtype)
+                        out_var.shape, out_dtype, -limit, limit, self._seed,
+                        _current_expected_place())
+                elif _in_legacy_dygraph():
+                    out_var = _C_ops.uniform_random('shape', out_var.shape,
+                                                    'min', -limit, 'max', limit,
+                                                    'seed', self._seed, 'dtype',
+                                                    out_dtype)
            else:
                std = math.sqrt(2.0 / float(fan_in + fan_out))
@@ -617,6 +624,9 @@ class XavierInitializer(Initializer):
            if var.dtype == VarDesc.VarType.FP16 or (
                    var.dtype == VarDesc.VarType.BF16 and not self._uniform):
+                if in_dygraph_mode():
+                    var_tmp = _C_ops.final_state_cast(out_var, var.dtype)
+                elif _in_legacy_dygraph():
                    var_tmp = _C_ops.cast(out_var, 'in_dtype', out_var.dtype,
                                          'out_dtype', var.dtype)
                var_tmp._share_underline_tensor_to(var)

--- a/python/paddle/fluid/tests/unittests/test_slice_op.py
+++ b/python/paddle/fluid/tests/unittests/test_slice_op.py
@@ -21,7 +21,7 @@ from op_test import OpTest, convert_float_to_uint16
 import paddle.fluid as fluid
 import paddle.fluid.layers as layers
 import paddle
-from paddle.fluid.framework import _test_eager_guard
+from paddle.fluid.framework import _test_eager_guard, _enable_legacy_dygraph
 paddle.enable_static()
@@ -787,7 +787,6 @@ class TestInferShape(unittest.TestCase):
        self.assertEqual(out0.shape, (3, 3, 5))
    def test_axis_less_than_zero(self):
        # Using paddle.disable_static will make other unittests fail.
        with fluid.dygraph.guard():
            x_arr = np.arange(0, 24, dtype=np.float32).reshape([2, 3, 4])
@@ -829,6 +828,7 @@ class TestInferShape(unittest.TestCase):
 class TestImperativeCUDAPinnedInput(unittest.TestCase):
    def test_input_cuda_pinned_var(self):
+        _enable_legacy_dygraph()
        with fluid.dygraph.guard():
            data = np.random.random((2, 80, 16128)).astype('float32')
            var = core.VarBase(value=data,

--- a/python/paddle/fluid/variable_index.py
+++ b/python/paddle/fluid/variable_index.py
@@ -490,8 +490,21 @@ def _getitem_impl_(var, item):
    out = var
    if len(axes) > 0:
-        target_block = default_main_program().current_block()
        op_type = "strided_slice" if use_strided_slice else "slice"
+        if paddle.fluid.framework.in_dygraph_mode() and op_type == "slice":
+            if "StartsTensorList" in inputs.keys():
+                st = inputs['StartsTensorList']
+            else:
+                st = attrs['starts']
+            if "EndsTensorList" in inputs.keys():
+                end = inputs['EndsTensorList']
+            else:
+                end = attrs['ends']
+            out = paddle._C_ops.final_state_slice(var, axes, st, end,
+                                                  attrs['infer_flags'],
+                                                  attrs['decrease_axis'])
+        else:
+            target_block = default_main_program().current_block()
            slice_out_var = target_block.create_var(
                name=unique_name.generate_with_ignorable_key(var.name + "_" +

--- a/python/paddle/nn/functional/activation.py
+++ b/python/paddle/nn/functional/activation.py
@@ -964,7 +964,9 @@ def silu(x, name=None):
            out = F.silu(x) # [ 0.731059, 1.761594, 2.857722, 3.928055 ]
    """
-    if in_dynamic_mode():
+    if in_dygraph_mode():
+        return _C_ops.final_state_silu(x)
+    if _in_legacy_dygraph():
        return _C_ops.silu(x)
    check_variable_and_dtype(x, 'x', ['float16', 'float32', 'float64'], 'silu')

--- a/python/paddle/nn/functional/norm.py
+++ b/python/paddle/nn/functional/norm.py
@@ -82,7 +82,7 @@ def normalize(x, p=2, axis=1, epsilon=1e-12, name=None):
    if in_dygraph_mode():
        eps = fluid.dygraph.base.to_variable([epsilon], dtype=x.dtype)
        out = _C_ops.final_state_p_norm(x, float(p), axis, epsilon, True, False)
-        return x / _C_ops.elementwise_max(out, eps)
+        return x / _C_ops.final_state_maximum(out, eps)
    if _in_legacy_dygraph():
        eps = fluid.dygraph.base.to_variable([epsilon], dtype=x.dtype)

--- a/python/paddle/nn/layer/norm.py
+++ b/python/paddle/nn/layer/norm.py
@@ -49,7 +49,7 @@ from .. import functional as F
 from paddle import _C_ops
 from .. import Layer
 from paddle import in_dynamic_mode
-from paddle.fluid.framework import in_dygraph_mode
+from paddle.fluid.framework import in_dygraph_mode, _in_legacy_dygraph
 __all__ = []
@@ -411,7 +411,15 @@ class GroupNorm(Layer):
        variance_out = self._helper.create_variable_for_type_inference(
            dtype=input.dtype, stop_gradient=True)
-        if _non_static_mode():
+        if in_dygraph_mode():
+            pre_act = _C_ops.final_state_group_norm(input, self.weight,
+                                                    self.bias, self._epsilon,
+                                                    self._num_groups, "NCHW")
+            return dygraph_utils._append_activation_in_dygraph(pre_act,
+                                                               act=None)
+        elif _in_legacy_dygraph():
            pre_act, _, _ = _C_ops.group_norm(
                input,
                self.weight,

--- a/python/paddle/tensor/manipulation.py
+++ b/python/paddle/tensor/manipulation.py
@@ -197,10 +197,9 @@ def slice(input, axes, starts, ends):
                if isinstance(item, tmp_tensor_type) else item
                for item in starts
            ]
-            attrs += ('starts', starts)
        elif isinstance(starts, tmp_tensor_type):
-            starts_tensor = starts
+            tensor_t = starts.numpy()
-            starts.stop_gradient = True
+            starts = [ele for ele in tensor_t]
            infer_flags = list(-1 for i in range(len(axes)))
        if isinstance(ends, (list, tuple)):
@@ -208,13 +207,13 @@ def slice(input, axes, starts, ends):
                item.numpy().item(0)
                if isinstance(item, tmp_tensor_type) else item for item in ends
            ]
-            attrs += ('ends', ends)
        elif isinstance(ends, tmp_tensor_type):
-            ends_tensor = ends
+            etensor_t = ends.numpy()
-            ends_tensor.stop_gradient = True
+            ends = [ele for ele in tensor_t]
            infer_flags = list(-1 for i in range(len(axes)))
-        return _C_ops.slice(input, starts_tensor, ends_tensor, None, None,
-                            'axes', axes, 'infer_flags', infer_flags, *attrs)
+        return _C_ops.final_state_slice(input, axes, starts, ends, infer_flags,
+                                        [])
    else:
        if _in_legacy_dygraph():
            attrs = ()
@@ -1817,6 +1816,11 @@ def split(x, num_or_sections, axis=0, name=None):
            raise TypeError(
                "The type of 'num_or_sections' in split must be int, list or tuple in imperative mode, but "
                "received %s." % (type(num_or_sections)))
+        if in_dygraph_mode():
+            return _C_ops.final_state_split(
+                input, [num_or_sections]
+                if isinstance(num_or_sections, int) else num_or_sections, dim)
+        elif _in_legacy_dygraph():
            out = [_varbase_creator() for n in range(num)]
            _C_ops.split(input, out, *attrs)
            return out