【code format check upgrade】 step2：yapf (#42944)

* use yapf to format all python file * yapf exclude two unittests file for they rely on writing and reading file, and format will break them * disable diff_py_file because too many diff files cause command following failed

【code format check upgrade】 step2：yapf (#42944)
* use yapf to format all python file * yapf exclude two unittests file for they rely on writing and reading file, and format will break them * disable diff_py_file because too many diff files cause command following failed
a072fca8 · Sing_chan · GitHub · 92568edb · a072fca8 · a072fca8
1000 changed file
--- a/.pre-commit-config.yaml
+++ b/.pre-commit-config.yaml
@@ -4,11 +4,16 @@ repos:
    hooks:
    -   id: remove-crlf
        files: (?!.*third_party)^.*$ | (?!.*book)^.*$
-   repo: https://github.com/PaddlePaddle/mirrors-yapf.git
+-   repo: https://github.com/google/yapf
-    sha: 0d79c0c469bab64f7229c9aca2b1186ef47f0e37
+    sha: v0.32.0
    hooks:
    -   id: yapf
        files: (.*\.(py|bzl)|BUILD|.*\.BUILD|WORKSPACE)$
+        exclude: |
+            (?x)^(
+                python/paddle/fluid/tests/unittests/dygraph_to_static/test_error.py|
+                python/paddle/fluid/tests/unittests/dygraph_to_static/test_origin_info.py
+            )$
 -   repo: https://github.com/pre-commit/pre-commit-hooks
    rev: v4.1.0
    hooks:

--- a/paddle/scripts/paddle_build.sh
+++ b/paddle/scripts/paddle_build.sh
@@ -481,10 +481,10 @@ EOF
 }
 function cmake_gen_and_build() {
-    startTime_s=`date +%s`
+    startTime_s=100
    cmake_gen $1
    build $2
-    endTime_s=`date +%s`
+    endTime_s=200
    [ -n "$startTime_firstBuild" ] && startTime_s=$startTime_firstBuild
    echo "Build Time: $[ $endTime_s - $startTime_s ]s"
    echo "ipipe_log_param_Build_Time: $[ $endTime_s - $startTime_s ]s" >> ${PADDLE_ROOT}/build/build_summary.txt
@@ -1130,8 +1130,8 @@ EOF
 function check_diff_file_for_coverage() {
    diff_h_file=$(git diff --name-status test develop | awk '$1 != "D" {print $2}' | grep '\.h$' | awk -F "/" '{printf "%s,",$NF}')
    diff_cc_file=$(git diff --name-status test develop | awk '$1 != "D" {print $2}' | grep -E '\.(cc|c)$' | awk -F "/" '{printf "%s,",$NF}')
-    diff_py_file=$(git diff --name-status test develop | grep '\.py$' | awk '$1 != "D" {printf "%s,",$2}')
+    #diff_py_file=$(git diff --name-status test develop | grep '\.py$' | awk '$1 != "D" {printf "%s,",$2}')
+    diff_py_file='tools/test_sampcd_processor.py,tools/timeline.py'
    export PADDLE_GIT_DIFF_H_FILE=${diff_h_file%*,}
    export PADDLE_GIT_DIFF_CC_FILE=${diff_cc_file%*,}
    export PADDLE_GIT_DIFF_PY_FILE=${diff_py_file%*,}

--- a/python/paddle/_C_ops.py
+++ b/python/paddle/_C_ops.py
@@ -14,6 +14,7 @@
 from paddle.fluid import core
 from .fluid import framework
 __all__ = []
 _already_switch_to_eager_ = False

--- a/python/paddle/__init__.py
+++ b/python/paddle/__init__.py
@@ -24,6 +24,7 @@ except ImportError:
 from .batch import batch  # noqa: F401
 from .framework import monkey_patch_variable
 from .framework import monkey_patch_math_varbase
 monkey_patch_variable()
 monkey_patch_math_varbase()
@@ -52,6 +53,7 @@ if fluid.framework._in_eager_mode_:
    Tensor = framework.core.eager.Tensor
 else:
    from .framework import VarBase as Tensor  # noqa: F401
 Tensor.__qualname__ = 'Tensor'  # noqa: F401
 import paddle.compat  # noqa: F401
 import paddle.distributed  # noqa: F401
@@ -372,272 +374,272 @@ if is_compiled_with_cinn():
 disable_static()
 __all__ = [  # noqa
-           'dtype',
+    'dtype',
-           'uint8',
+    'uint8',
-           'int8',
+    'int8',
-           'int16',
+    'int16',
-           'int32',
+    'int32',
-           'int64',
+    'int64',
-           'float16',
+    'float16',
-           'float32',
+    'float32',
-           'float64',
+    'float64',
-           'bfloat16',
+    'bfloat16',
-           'bool',
+    'bool',
-           'complex64',
+    'complex64',
-           'complex128',
+    'complex128',
-           'addmm',
+    'addmm',
-           'allclose',
+    'allclose',
-           'isclose',
+    'isclose',
-           't',
+    't',
-           'add',
+    'add',
-           'subtract',
+    'subtract',
-           'diag',
+    'diag',
-           'diagflat',
+    'diagflat',
-           'isnan',
+    'isnan',
-           'scatter_nd_add',
+    'scatter_nd_add',
-           'unstack',
+    'unstack',
-           'get_default_dtype',
+    'get_default_dtype',
-           'save',
+    'save',
-           'multinomial',
+    'multinomial',
-           'get_cuda_rng_state',
+    'get_cuda_rng_state',
-           'rank',
+    'rank',
-           'empty_like',
+    'empty_like',
-           'eye',
+    'eye',
-           'cumsum',
+    'cumsum',
-           'cumprod',
+    'cumprod',
-           'logit',
+    'logit',
-           'sign',
+    'sign',
-           'is_empty',
+    'is_empty',
-           'equal',
+    'equal',
-           'equal_all',
+    'equal_all',
-           'is_tensor',
+    'is_tensor',
-           'is_complex',
+    'is_complex',
-           'is_integer',
+    'is_integer',
-           'cross',
+    'cross',
-           'where',
+    'where',
-           'log1p',
+    'log1p',
-           'cos',
+    'cos',
-           'tan',
+    'tan',
-           'mean',
+    'mean',
-           'mode',
+    'mode',
-           'mv',
+    'mv',
-           'in_dynamic_mode',
+    'in_dynamic_mode',
-           'min',
+    'min',
-           'amin',
+    'amin',
-           'any',
+    'any',
-           'slice',
+    'slice',
-           'normal',
+    'normal',
-           'logsumexp',
+    'logsumexp',
-           'full',
+    'full',
-           'unsqueeze',
+    'unsqueeze',
-           'unsqueeze_',
+    'unsqueeze_',
-           'argmax',
+    'argmax',
-           'Model',
+    'Model',
-           'summary',
+    'summary',
-           'flops',
+    'flops',
-           'sort',
+    'sort',
-           'searchsorted',
+    'searchsorted',
-           'split',
+    'split',
-           'logical_and',
+    'logical_and',
-           'full_like',
+    'full_like',
-           'less_than',
+    'less_than',
-           'kron',
+    'kron',
-           'clip',
+    'clip',
-           'Tensor',
+    'Tensor',
-           'crop',
+    'crop',
-           'ParamAttr',
+    'ParamAttr',
-           'stanh',
+    'stanh',
-           'randint',
+    'randint',
-           'randint_like',
+    'randint_like',
-           'assign',
+    'assign',
-           'gather',
+    'gather',
-           'scale',
+    'scale',
-           'zeros',
+    'zeros',
-           'rsqrt',
+    'rsqrt',
-           'squeeze',
+    'squeeze',
-           'squeeze_',
+    'squeeze_',
-           'to_tensor',
+    'to_tensor',
-           'gather_nd',
+    'gather_nd',
-           'isinf',
+    'isinf',
-           'uniform',
+    'uniform',
-           'floor_divide',
+    'floor_divide',
-           'remainder',
+    'remainder',
-           'floor_mod',
+    'floor_mod',
-           'roll',
+    'roll',
-           'batch',
+    'batch',
-           'max',
+    'max',
-           'amax',
+    'amax',
-           'logical_or',
+    'logical_or',
-           'bitwise_and',
+    'bitwise_and',
-           'bitwise_or',
+    'bitwise_or',
-           'bitwise_xor',
+    'bitwise_xor',
-           'bitwise_not',
+    'bitwise_not',
-           'mm',
+    'mm',
-           'flip',
+    'flip',
-           'rot90',
+    'rot90',
-           'bincount',
+    'bincount',
-           'histogram',
+    'histogram',
-           'multiplex',
+    'multiplex',
-           'CUDAPlace',
+    'CUDAPlace',
-           'NPUPlace',
+    'NPUPlace',
-           'empty',
+    'empty',
-           'shape',
+    'shape',
-           'real',
+    'real',
-           'imag',
+    'imag',
-           'is_floating_point',
+    'is_floating_point',
-           'complex',
+    'complex',
-           'reciprocal',
+    'reciprocal',
-           'rand',
+    'rand',
-           'less_equal',
+    'less_equal',
-           'triu',
+    'triu',
-           'sin',
+    'sin',
-           'dist',
+    'dist',
-           'unbind',
+    'unbind',
-           'meshgrid',
+    'meshgrid',
-           'arange',
+    'arange',
-           'load',
+    'load',
-           'numel',
+    'numel',
-           'median',
+    'median',
-           'nanmedian',
+    'nanmedian',
-           'quantile',
+    'quantile',
-           'nanquantile',
+    'nanquantile',
-           'no_grad',
+    'no_grad',
-           'set_grad_enabled',
+    'set_grad_enabled',
-           'is_grad_enabled',
+    'is_grad_enabled',
-           'mod',
+    'mod',
-           'abs',
+    'abs',
-           'tril',
+    'tril',
-           'pow',
+    'pow',
-           'zeros_like',
+    'zeros_like',
-           'maximum',
+    'maximum',
-           'topk',
+    'topk',
-           'index_select',
+    'index_select',
-           'CPUPlace',
+    'CPUPlace',
-           'matmul',
+    'matmul',
-           'seed',
+    'seed',
-           'acos',
+    'acos',
-           'logical_xor',
+    'logical_xor',
-           'exp',
+    'exp',
-           'expm1',
+    'expm1',
-           'bernoulli',
+    'bernoulli',
-           'poisson',
+    'poisson',
-           'sinh',
+    'sinh',
-           'round',
+    'round',
-           'DataParallel',
+    'DataParallel',
-           'argmin',
+    'argmin',
-           'prod',
+    'prod',
-           'broadcast_shape',
+    'broadcast_shape',
-           'conj',
+    'conj',
-           'neg',
+    'neg',
-           'lgamma',
+    'lgamma',
-           'lerp',
+    'lerp',
-           'erfinv',
+    'erfinv',
-           'inner',
+    'inner',
-           'outer',
+    'outer',
-           'square',
+    'square',
-           'divide',
+    'divide',
-           'ceil',
+    'ceil',
-           'atan',
+    'atan',
-           'atan2',
+    'atan2',
-           'rad2deg',
+    'rad2deg',
-           'deg2rad',
+    'deg2rad',
-           'gcd',
+    'gcd',
-           'lcm',
+    'lcm',
-           'expand',
+    'expand',
-           'broadcast_to',
+    'broadcast_to',
-           'ones_like',
+    'ones_like',
-           'index_sample',
+    'index_sample',
-           'cast',
+    'cast',
-           'grad',
+    'grad',
-           'all',
+    'all',
-           'ones',
+    'ones',
-           'not_equal',
+    'not_equal',
-           'sum',
+    'sum',
-           'nansum',
+    'nansum',
-           'nanmean',
+    'nanmean',
-           'tile',
+    'tile',
-           'greater_equal',
+    'greater_equal',
-           'isfinite',
+    'isfinite',
-           'create_parameter',
+    'create_parameter',
-           'dot',
+    'dot',
-           'increment',
+    'increment',
-           'erf',
+    'erf',
-           'bmm',
+    'bmm',
-           'chunk',
+    'chunk',
-           'tolist',
+    'tolist',
-           'tensordot',
+    'tensordot',
-           'greater_than',
+    'greater_than',
-           'shard_index',
+    'shard_index',
-           'argsort',
+    'argsort',
-           'tanh',
+    'tanh',
-           'tanh_',
+    'tanh_',
-           'transpose',
+    'transpose',
-           'randn',
+    'randn',
-           'strided_slice',
+    'strided_slice',
-           'unique',
+    'unique',
-           'unique_consecutive',
+    'unique_consecutive',
-           'set_cuda_rng_state',
+    'set_cuda_rng_state',
-           'set_printoptions',
+    'set_printoptions',
-           'std',
+    'std',
-           'flatten',
+    'flatten',
-           'asin',
+    'asin',
-           'multiply',
+    'multiply',
-           'disable_static',
+    'disable_static',
-           'masked_select',
+    'masked_select',
-           'var',
+    'var',
-           'trace',
+    'trace',
-           'enable_static',
+    'enable_static',
-           'scatter_nd',
+    'scatter_nd',
-           'set_default_dtype',
+    'set_default_dtype',
-           'disable_signal_handler',
+    'disable_signal_handler',
-           'expand_as',
+    'expand_as',
-           'stack',
+    'stack',
-           'sqrt',
+    'sqrt',
-           'randperm',
+    'randperm',
-           'linspace',
+    'linspace',
-           'logspace',
+    'logspace',
-           'reshape',
+    'reshape',
-           'reshape_',
+    'reshape_',
-           'reverse',
+    'reverse',
-           'nonzero',
+    'nonzero',
-           'CUDAPinnedPlace',
+    'CUDAPinnedPlace',
-           'logical_not',
+    'logical_not',
-           'add_n',
+    'add_n',
-           'minimum',
+    'minimum',
-           'scatter',
+    'scatter',
-           'scatter_',
+    'scatter_',
-           'floor',
+    'floor',
-           'cosh',
+    'cosh',
-           'log',
+    'log',
-           'log2',
+    'log2',
-           'log10',
+    'log10',
-           'concat',
+    'concat',
-           'check_shape',
+    'check_shape',
-           'trunc',
+    'trunc',
-           'frac',
+    'frac',
-           'digamma',
+    'digamma',
-           'standard_normal',
+    'standard_normal',
-           'diagonal',
+    'diagonal',
-           'broadcast_tensors',
+    'broadcast_tensors',
-           'einsum',
+    'einsum',
-           'set_flags',
+    'set_flags',
-           'get_flags',
+    'get_flags',
-           'asinh',
+    'asinh',
-           'acosh',
+    'acosh',
-           'atanh',
+    'atanh',
-           'as_complex',
+    'as_complex',
-           'as_real',
+    'as_real',
-           'diff',
+    'diff',
-           'angle',
+    'angle',
-           'fmax',
+    'fmax',
-           'fmin',
+    'fmin',
-           'moveaxis',
+    'moveaxis',
-           'repeat_interleave',
+    'repeat_interleave',
-           'clone',
+    'clone',
-           'kthvalue',
+    'kthvalue',
-           'renorm',
+    'renorm',
-           'take_along_axis',
+    'take_along_axis',
-           'put_along_axis',
+    'put_along_axis',
-           'heaviside',
+    'heaviside',
-           'tril_indices',
+    'tril_indices',
 ]
--- a/python/paddle/amp/grad_scaler.py
+++ b/python/paddle/amp/grad_scaler.py
@@ -83,10 +83,10 @@ class GradScaler(AmpScaler):
                 incr_every_n_steps=1000,
                 decr_every_n_nan_or_inf=2,
                 use_dynamic_loss_scaling=True):
-        super(GradScaler, self).__init__(enable, init_loss_scaling, incr_ratio,
+        super(GradScaler,
-                                         decr_ratio, incr_every_n_steps,
+              self).__init__(enable, init_loss_scaling, incr_ratio, decr_ratio,
-                                         decr_every_n_nan_or_inf,
+                             incr_every_n_steps, decr_every_n_nan_or_inf,
-                                         use_dynamic_loss_scaling)
+                             use_dynamic_loss_scaling)
    def scale(self, var):
        """

--- a/python/paddle/autograd/backward_mode.py
+++ b/python/paddle/autograd/backward_mode.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -16,6 +16,7 @@ from paddle.fluid import core
 from paddle.fluid import framework
 from paddle.fluid.backward import gradients_with_optimizer
 import paddle
 __all__ = []
@@ -81,14 +82,16 @@ def backward(tensors, grad_tensors=None, retain_graph=False):
        if isinstance(in_out_list, (list, tuple)):
            assert len(in_out_list) > 0, "{} connot be empyt".format(name)
            for each_var in in_out_list:
-                assert isinstance(each_var, (
+                assert isinstance(
-                    paddle.Tensor, core.eager.Tensor
+                    each_var,
-                )), "Elements of {} must be paddle.Tensor".format(name)
+                    (paddle.Tensor, core.eager.Tensor
+                     )), "Elements of {} must be paddle.Tensor".format(name)
            return in_out_list
        else:
-            assert isinstance(in_out_list, (
+            assert isinstance(
-                paddle.Tensor, core.eager.Tensor
+                in_out_list,
-            )), "{} must be Tensor or list of Tensor".format(name)
+                (paddle.Tensor, core.eager.Tensor
+                 )), "{} must be Tensor or list of Tensor".format(name)
            return [in_out_list]
    tensors = check_tensors(tensors, "tensors")

--- a/python/paddle/autograd/functional.py
+++ b/python/paddle/autograd/functional.py
@@ -139,7 +139,7 @@ def _double_backward_trick(ys, xs, v):
    """Double backward trick for computing ``jvp`` by ``vjp``
    see details: https://j-towns.github.io/2017/06/12/A-new-trick.html
    """
-    # The value of ys_grad is not important, it can be any random value in 
+    # The value of ys_grad is not important, it can be any random value in
    # theory, but it's required to set stop_gradient=False.
    ys_grad = _zeros_like_with_grad(ys)
    xs_grad = _grad(ys, xs, ys_grad)
@@ -302,10 +302,11 @@ class Hessian(object):
    """
    def __init__(self, func, xs, is_batched=False):
        def _jac_func(*xs):
            jac = Jacobian(func, xs, is_batched=is_batched)
-            if (is_batched and jac.shape[1] != 1) or (not is_batched and
+            if (is_batched and jac.shape[1] != 1) or (not is_batched
-                                                      jac.shape[0] != 1):
+                                                      and jac.shape[0] != 1):
                raise RuntimeError(
                    "The function given to Hessian shoud return as single element Tensor or batched single element Tensor."
                )
@@ -362,18 +363,18 @@ class _Jacobian(object):
    def _lazy_indexes(self, indexes):
        idx = indexes[self._lazy_axis]
-        return (idx, ) if isinstance(
+        return (idx, ) if isinstance(idx, int) else tuple(
-            idx, int) else tuple(range(idx.start, idx.stop, idx.step))
+            range(idx.start, idx.stop, idx.step))
    def _flatten(self, xs):
        raise NotImplementedError
    def _shifted_indexes(self, indexes, lazy_axis_size=0):
        idx = indexes[self._lazy_axis]
-        shifted_lazy_axis_idx = 0 if isinstance(
+        shifted_lazy_axis_idx = 0 if isinstance(idx, int) else slice(
-            idx, int) else slice(0, lazy_axis_size, 1)
+            0, lazy_axis_size, 1)
-        return indexes[:self._lazy_axis] + (shifted_lazy_axis_idx,
+        return indexes[:self._lazy_axis] + (
-                                            ) + indexes[self._lazy_axis + 1:]
+            shifted_lazy_axis_idx, ) + indexes[self._lazy_axis + 1:]
    def __getitem__(self, indexes):
        indexes = _multi_index(indexes, self.shape)
@@ -381,8 +382,8 @@ class _Jacobian(object):
        if isinstance(indexes[self._lazy_axis], int):
            other_indexes = indexes[:self._lazy_axis] + \
                indexes[self._lazy_axis+1:]
-            return self._cached_evaluate(indexes[self._lazy_axis])[
+            return self._cached_evaluate(
-                other_indexes]
+                indexes[self._lazy_axis])[other_indexes]
        lazy_indexes = self._lazy_indexes(indexes)
        part_jac = paddle.stack(
            [self._cached_evaluate(i) for i in lazy_indexes],
@@ -424,7 +425,8 @@ class _JacobianNoBatch(_Jacobian):
    def _evaluate(self, row_index):
        return self._flatten(_grad(
            self._flatten_ys[row_index],
-            self._xs, ))
+            self._xs,
+        ))
 class _JacobianBatchLast(_Jacobian):
@@ -508,8 +510,8 @@ def _multi_index(indexes, shape):
    positive_indexes = []
    for i, index in enumerate(indexes):
        if isinstance(index, slice):
-            index = slice(index.start or 0, index.stop or shape[i],
+            index = slice(index.start or 0, index.stop or shape[i], index.step
-                          index.step or 1)
+                          or 1)
            positive_indexes.append(
                slice(
                    index.start + shape[i] if index.start < 0 else index.start,
@@ -530,9 +532,8 @@ def _as_tensors(xs):
 def _stack_tensor_or_return_none(origin_list):
    assert len(origin_list) > 0, "Can't not stack an empty list"
-    return paddle.stack(
+    return paddle.stack(origin_list, axis=0) if isinstance(
-        origin_list, axis=0) if isinstance(
+        origin_list[0], paddle.fluid.framework.Variable) else None
-            origin_list[0], paddle.fluid.framework.Variable) else None
 def _replace_none_with_zero_tensor(xs, refs):
@@ -809,23 +810,20 @@ def jacobian(func, inputs, create_graph=False, allow_unused=False):
    fin_size = len(inputs)
    fout_size = len(outputs)
    flat_outputs = tuple(
-        paddle.reshape(
+        paddle.reshape(output, shape=[-1]) for output in outputs)
-            output, shape=[-1]) for output in outputs)
    jacobian = tuple()
    for i, flat_output in enumerate(flat_outputs):
        jac_i = list([] for _ in range(fin_size))
        for k in range(len(flat_output)):
-            row_k = paddle.grad(
+            row_k = paddle.grad(flat_output[k],
-                flat_output[k],
+                                inputs,
-                inputs,
+                                create_graph=create_graph,
-                create_graph=create_graph,
+                                retain_graph=True,
-                retain_graph=True,
+                                allow_unused=allow_unused)
-                allow_unused=allow_unused)
            for j in range(fin_size):
                jac_i[j].append(
-                    paddle.reshape(
+                    paddle.reshape(row_k[j], shape=[-1]) if isinstance(
-                        row_k[j], shape=[-1])
+                        row_k[j], paddle.Tensor) else None)
-                    if isinstance(row_k[j], paddle.Tensor) else None)
        jacobian += (tuple(
            _stack_tensor_or_return_none(jac_i_j) for jac_i_j in jac_i), )
    if fin_size == 1 and fout_size == 1:
@@ -957,25 +955,22 @@ def batch_jacobian(func, inputs, create_graph=False, allow_unused=False):
    fin_size = len(inputs)
    fout_size = len(outputs)
    flat_outputs = tuple(
-        paddle.reshape(
+        paddle.reshape(output, shape=[batch_size, -1]) for output in outputs)
-            output, shape=[batch_size, -1]) for output in outputs)
    jacobian = tuple()
    for i, flat_output in enumerate(flat_outputs):
        jac_i = list([] for _ in range(fin_size))
        for k in range(flat_output.shape[1]):
-            row_k = paddle.grad(
+            row_k = paddle.grad(flat_output[:, k],
-                flat_output[:, k],
+                                inputs,
-                inputs,
+                                create_graph=create_graph,
-                create_graph=create_graph,
+                                retain_graph=True,
-                retain_graph=True,
+                                allow_unused=allow_unused)
-                allow_unused=allow_unused)
            for j in range(fin_size):
                jac_i[j].append(
-                    paddle.reshape(
+                    paddle.reshape(row_k[j], shape=[-1]) if isinstance(
-                        row_k[j], shape=[-1])
+                        row_k[j], paddle.Tensor) else None)
-                    if isinstance(row_k[j], paddle.Tensor) else None)
        jacobian += (tuple(
            _stack_tensor_or_return_none(jac_i_j) for jac_i_j in jac_i), )
    if fin_size == 1 and fout_size == 1:
@@ -1119,18 +1114,19 @@ def batch_hessian(func, inputs, create_graph=False, allow_unused=False):
    ], "The function to compute batched Hessian matrix should return a Tensor of shape [batch_size, 1]"
    def jac_func(*ins):
-        grad_inputs = paddle.grad(
+        grad_inputs = paddle.grad(outputs,
-            outputs,
+                                  ins,
-            ins,
+                                  create_graph=True,
-            create_graph=True,
+                                  retain_graph=True,
-            retain_graph=True,
+                                  allow_unused=allow_unused)
-            allow_unused=allow_unused)
        return tuple(
            _replace_none_with_zero_tensor(grad_inputs[i], inputs[i])
            for i in range(len(inputs)))
-    return batch_jacobian(
+    return batch_jacobian(jac_func,
-        jac_func, inputs, create_graph=create_graph, allow_unused=allow_unused)
+                          inputs,
+                          create_graph=create_graph,
+                          allow_unused=allow_unused)
 @framework.dygraph_only
@@ -1245,18 +1241,19 @@ def hessian(func, inputs, create_graph=False, allow_unused=False):
    ], "The function to compute Hessian matrix should return a Tensor with a single element"
    def jac_func(*ins):
-        grad_inputs = paddle.grad(
+        grad_inputs = paddle.grad(outputs,
-            outputs,
+                                  ins,
-            ins,
+                                  create_graph=True,
-            create_graph=True,
+                                  retain_graph=True,
-            retain_graph=True,
+                                  allow_unused=allow_unused)
-            allow_unused=allow_unused)
        return tuple(
            _replace_none_with_zero_tensor(grad_inputs[i], inputs[i])
            for i in range(len(inputs)))
-    return jacobian(
+    return jacobian(jac_func,
-        jac_func, inputs, create_graph=create_graph, allow_unused=allow_unused)
+                    inputs,
+                    create_graph=create_graph,
+                    allow_unused=allow_unused)
 def vhp(func, inputs, v=None, create_graph=False, allow_unused=False):

--- a/python/paddle/autograd/py_layer.py
+++ b/python/paddle/autograd/py_layer.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -17,6 +17,7 @@ from paddle.fluid.framework import dygraph_only
 from paddle.fluid.dygraph.amp.auto_cast import amp_state
 from paddle.amp.auto_cast import auto_cast
 from paddle.fluid import core
 __all__ = []
@@ -123,7 +124,9 @@ class PyLayerContext(object):
 def with_mateclass(meta, *bases):
    class impl(meta):
        def __new__(cls, name, temp_bases, attrs):
            return meta(name, bases, attrs)
@@ -131,6 +134,7 @@ def with_mateclass(meta, *bases):
 class CPyLayer(object):
    @classmethod
    @dygraph_only
    def apply(cls, *args, **kwargs):
@@ -178,6 +182,7 @@ class CPyLayer(object):
 class PyLayerBackward(PyLayerContext):
    def backward(self, *args, **kwargs):
        with paddle.fluid.dygraph.guard():
            with paddle.fluid.dygraph.no_grad():
@@ -192,6 +197,7 @@ class PyLayerBackward(PyLayerContext):
 class LayerMeta(type):
    def __init__(cls, name, bases, attrs):
        cls._backward_function = type(name + '_backward', (PyLayerBackward, ),
                                      {"_forward_cls": cls})
@@ -330,6 +336,7 @@ class PyLayer(with_mateclass(LayerMeta, CPyLayer)):
 class EagerPyLayerContext(object):
    def save_for_backward(self, *tensors):
        """
        Saves given tensors that backward need. Use ``saved_tensor`` in the `backward` to get the saved tensors.
@@ -494,11 +501,13 @@ class EagerPyLayerContext(object):
 class EagerPyLayerBackward(core.eager.PyLayer, EagerPyLayerContext):
    def backward(self, *args):
        return self._forward_cls.backward(self, *args)
 class EagerPyLayerMeta(type):
    def __init__(cls, name, bases, attrs):
        cls._backward_function = type(name + '_backward',
                                      (EagerPyLayerBackward, ),
@@ -510,6 +519,7 @@ class EagerPyLayerMeta(type):
 class EagerPyLayer(
        with_mateclass(EagerPyLayerMeta, core.eager.PyLayer,
                       EagerPyLayerContext)):
    @staticmethod
    def forward(ctx, *args, **kwargs):
        """
@@ -590,6 +600,7 @@ class EagerPyLayer(
 def once_differentiable(backward):
    def wrapper(ctx, *args):
        with paddle.fluid.dygraph.no_grad():
            outputs = backward(ctx, *args)

--- a/python/paddle/callbacks.py
+++ b/python/paddle/callbacks.py
@@ -21,11 +21,6 @@ from .hapi.callbacks import EarlyStopping  # noqa: F401
 from .hapi.callbacks import ReduceLROnPlateau  # noqa: F401
 __all__ = [  #noqa
-    'Callback',
+    'Callback', 'ProgBarLogger', 'ModelCheckpoint', 'VisualDL', 'LRScheduler',
-    'ProgBarLogger',
+    'EarlyStopping', 'ReduceLROnPlateau'
-    'ModelCheckpoint',
-    'VisualDL',
-    'LRScheduler',
-    'EarlyStopping',
-    'ReduceLROnPlateau'
 ]
--- a/python/paddle/cost_model/__init__.py
+++ b/python/paddle/cost_model/__init__.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -13,4 +13,5 @@
 # limitations under the License.
 from .cost_model import CostModel  # noqa: F401
 __all__ = ['CostModel']
--- a/python/paddle/cost_model/cost_model.py
+++ b/python/paddle/cost_model/cost_model.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -21,6 +21,7 @@ from paddle.fluid import core
 class CostModel():
    def __init__(self):
        pass
@@ -29,10 +30,11 @@ class CostModel():
        main_program = static.Program()
        startup_program = static.Program()
-        with static.program_guard(
+        with static.program_guard(main_program=main_program,
-                main_program=main_program, startup_program=startup_program):
+                                  startup_program=startup_program):
-            data = paddle.static.data(
+            data = paddle.static.data(name='X',
-                name='X', shape=[None, 1], dtype='float32')
+                                      shape=[None, 1],
+                                      dtype='float32')
            hidden = paddle.static.nn.fc(data, 10)
            loss = paddle.mean(hidden)
            paddle.optimizer.SGD(learning_rate=0.01).minimize(loss)
@@ -59,8 +61,8 @@ class CostModel():
        cost_data = cost_model.ProfileMeasure(device)
    def static_cost_data(self):
-        static_cost_data_path = os.path.join(
+        static_cost_data_path = os.path.join(os.path.dirname(__file__),
-            os.path.dirname(__file__), "static_op_benchmark.json")
+                                             "static_op_benchmark.json")
        with open(static_cost_data_path, 'r') as load_f:
            load_dict = json.load(load_f)
        self._static_cost_data = load_dict

--- a/python/paddle/dataset/cifar.py
+++ b/python/paddle/dataset/cifar.py
@@ -47,10 +47,11 @@ CIFAR100_MD5 = 'eb9058c3a382ffc7106e4002c42a8d85'
 def reader_creator(filename, sub_name, cycle=False):
    def read_batch(batch):
        data = batch[six.b('data')]
-        labels = batch.get(
+        labels = batch.get(six.b('labels'), batch.get(six.b('fine_labels'),
-            six.b('labels'), batch.get(six.b('fine_labels'), None))
+                                                      None))
        assert labels is not None
        for sample, label in six.moves.zip(data, labels):
            yield (sample / 255.0).astype(numpy.float32), int(label)
@@ -129,10 +130,10 @@ def train10(cycle=False):
    :return: Training reader creator
    :rtype: callable
    """
-    return reader_creator(
+    return reader_creator(paddle.dataset.common.download(
-        paddle.dataset.common.download(CIFAR10_URL, 'cifar', CIFAR10_MD5),
+        CIFAR10_URL, 'cifar', CIFAR10_MD5),
-        'data_batch',
+                          'data_batch',
-        cycle=cycle)
+                          cycle=cycle)
 @deprecated(
@@ -152,10 +153,10 @@ def test10(cycle=False):
    :return: Test reader creator.
    :rtype: callable
    """
-    return reader_creator(
+    return reader_creator(paddle.dataset.common.download(
-        paddle.dataset.common.download(CIFAR10_URL, 'cifar', CIFAR10_MD5),
+        CIFAR10_URL, 'cifar', CIFAR10_MD5),
-        'test_batch',
+                          'test_batch',
-        cycle=cycle)
+                          cycle=cycle)
 @deprecated(

--- a/python/paddle/dataset/common.py
+++ b/python/paddle/dataset/common.py
@@ -64,9 +64,9 @@ def download(url, module_name, md5sum, save_name=None):
    if not os.path.exists(dirname):
        os.makedirs(dirname)
-    filename = os.path.join(dirname,
+    filename = os.path.join(
-                            url.split('/')[-1]
+        dirname,
-                            if save_name is None else save_name)
+        url.split('/')[-1] if save_name is None else save_name)
    if os.path.exists(filename) and md5file(filename) == md5sum:
        return filename
@@ -79,8 +79,9 @@ def download(url, module_name, md5sum, save_name=None):
        if retry < retry_limit:
            retry += 1
        else:
-            raise RuntimeError("Cannot download {0} within retry limit {1}".
+            raise RuntimeError(
-                               format(url, retry_limit))
+                "Cannot download {0} within retry limit {1}".format(
+                    url, retry_limit))
        sys.stderr.write("Cache file %s not found, downloading %s \n" %
                         (filename, url))
        sys.stderr.write("Begin to download\n")
@@ -98,8 +99,8 @@ def download(url, module_name, md5sum, save_name=None):
                    total_iter = total_length / chunk_size + 1
                    log_interval = total_iter // 20 if total_iter > 20 else 1
                    log_index = 0
-                    bar = paddle.hapi.progressbar.ProgressBar(
+                    bar = paddle.hapi.progressbar.ProgressBar(total_iter,
-                        total_iter, name='item')
+                                                              name='item')
                    for data in r.iter_content(chunk_size=chunk_size):
                        f.write(data)
                        log_index += 1
@@ -121,9 +122,8 @@ def fetch_all():
    ]:
        if "fetch" in dir(
                importlib.import_module("paddle.dataset.%s" % module_name)):
-            getattr(
+            getattr(importlib.import_module("paddle.dataset.%s" % module_name),
-                importlib.import_module("paddle.dataset.%s" % module_name),
+                    "fetch")()
-                "fetch")()
 def split(reader, line_count, suffix="%05d.pickle", dumper=pickle.dump):
@@ -206,5 +206,5 @@ def _check_exists_and_download(path, url, md5, module_name, download=True):
    if download:
        return paddle.dataset.common.download(url, module_name, md5)
    else:
-        raise ValueError('{} not exists and auto download disabled'.format(
+        raise ValueError(
-            path))
+            '{} not exists and auto download disabled'.format(path))
--- a/python/paddle/dataset/conll05.py
+++ b/python/paddle/dataset/conll05.py
@@ -152,6 +152,7 @@ def reader_creator(corpus_reader,
                   word_dict=None,
                   predicate_dict=None,
                   label_dict=None):
    def reader():
        for sentence, predicate, labels in corpus_reader():

--- a/python/paddle/dataset/flowers.py
+++ b/python/paddle/dataset/flowers.py
@@ -73,8 +73,11 @@ def default_mapper(is_train, sample):
    '''
    img, label = sample
    img = load_image_bytes(img)
-    img = simple_transform(
+    img = simple_transform(img,
-        img, 256, 224, is_train, mean=[103.94, 116.78, 123.68])
+                           256,
+                           224,
+                           is_train,
+                           mean=[103.94, 116.78, 123.68])
    return img.flatten().astype('float32'), label
@@ -164,15 +167,14 @@ def train(mapper=train_mapper, buffered_size=1024, use_xmap=True, cycle=False):
    :return: train data reader
    :rtype: callable
    '''
-    return reader_creator(
+    return reader_creator(download(DATA_URL, 'flowers', DATA_MD5),
-        download(DATA_URL, 'flowers', DATA_MD5),
+                          download(LABEL_URL, 'flowers', LABEL_MD5),
-        download(LABEL_URL, 'flowers', LABEL_MD5),
+                          download(SETID_URL, 'flowers', SETID_MD5),
-        download(SETID_URL, 'flowers', SETID_MD5),
+                          TRAIN_FLAG,
-        TRAIN_FLAG,
+                          mapper,
-        mapper,
+                          buffered_size,
-        buffered_size,
+                          use_xmap,
-        use_xmap,
+                          cycle=cycle)
-        cycle=cycle)
 @deprecated(
@@ -198,15 +200,14 @@ def test(mapper=test_mapper, buffered_size=1024, use_xmap=True, cycle=False):
    :return: test data reader
    :rtype: callable
    '''
-    return reader_creator(
+    return reader_creator(download(DATA_URL, 'flowers', DATA_MD5),
-        download(DATA_URL, 'flowers', DATA_MD5),
+                          download(LABEL_URL, 'flowers', LABEL_MD5),
-        download(LABEL_URL, 'flowers', LABEL_MD5),
+                          download(SETID_URL, 'flowers', SETID_MD5),
-        download(SETID_URL, 'flowers', SETID_MD5),
+                          TEST_FLAG,
-        TEST_FLAG,
+                          mapper,
-        mapper,
+                          buffered_size,
-        buffered_size,
+                          use_xmap,
-        use_xmap,
+                          cycle=cycle)
-        cycle=cycle)
 @deprecated(
@@ -230,11 +231,10 @@ def valid(mapper=test_mapper, buffered_size=1024, use_xmap=True):
    :return: test data reader
    :rtype: callable
    '''
-    return reader_creator(
+    return reader_creator(download(DATA_URL, 'flowers', DATA_MD5),
-        download(DATA_URL, 'flowers', DATA_MD5),
+                          download(LABEL_URL, 'flowers', LABEL_MD5),
-        download(LABEL_URL, 'flowers', LABEL_MD5),
+                          download(SETID_URL, 'flowers', SETID_MD5), VALID_FLAG,
-        download(SETID_URL, 'flowers', SETID_MD5), VALID_FLAG, mapper,
+                          mapper, buffered_size, use_xmap)
-        buffered_size, use_xmap)
 def fetch():

--- a/python/paddle/dataset/image.py
+++ b/python/paddle/dataset/image.py
@@ -45,10 +45,9 @@ if six.PY3:
    # will be the C++ execubable on Windows
    if sys.platform == 'win32' and 'python.exe' not in interpreter:
        interpreter = sys.exec_prefix + os.sep + 'python.exe'
-    import_cv2_proc = subprocess.Popen(
+    import_cv2_proc = subprocess.Popen([interpreter, "-c", "import cv2"],
-        [interpreter, "-c", "import cv2"],
+                                       stdout=subprocess.PIPE,
-        stdout=subprocess.PIPE,
+                                       stderr=subprocess.PIPE)
-        stderr=subprocess.PIPE)
    out, err = import_cv2_proc.communicate()
    retcode = import_cv2_proc.poll()
    if retcode != 0:
@@ -123,10 +122,9 @@ def batch_images_from_tar(data_file,
                output = {}
                output['label'] = labels
                output['data'] = data
-                pickle.dump(
+                pickle.dump(output,
-                    output,
+                            open('%s/batch_%d' % (out_path, file_id), 'wb'),
-                    open('%s/batch_%d' % (out_path, file_id), 'wb'),
+                            protocol=2)
-                    protocol=2)
                file_id += 1
                data = []
                labels = []
@@ -134,8 +132,9 @@ def batch_images_from_tar(data_file,
        output = {}
        output['label'] = labels
        output['data'] = data
-        pickle.dump(
+        pickle.dump(output,
-            output, open('%s/batch_%d' % (out_path, file_id), 'wb'), protocol=2)
+                    open('%s/batch_%d' % (out_path, file_id), 'wb'),
+                    protocol=2)
    with open(meta_file, 'a') as meta:
        for file in os.listdir(out_path):

--- a/python/paddle/dataset/imdb.py
+++ b/python/paddle/dataset/imdb.py
@@ -51,9 +51,9 @@ def tokenize(pattern):
        while tf != None:
            if bool(pattern.match(tf.name)):
                # newline and punctuations removal and ad-hoc tokenization.
-                yield tarf.extractfile(tf).read().rstrip(six.b(
+                yield tarf.extractfile(tf).read().rstrip(
-                    "\n\r")).translate(
+                    six.b("\n\r")).translate(None, six.b(
-                        None, six.b(string.punctuation)).lower().split()
+                        string.punctuation)).lower().split()
            tf = tarf.next()
@@ -117,9 +117,8 @@ def train(word_idx):
    :return: Training reader creator
    :rtype: callable
    """
-    return reader_creator(
+    return reader_creator(re.compile(r"aclImdb/train/pos/.*\.txt$"),
-        re.compile(r"aclImdb/train/pos/.*\.txt$"),
+                          re.compile(r"aclImdb/train/neg/.*\.txt$"), word_idx)
-        re.compile(r"aclImdb/train/neg/.*\.txt$"), word_idx)
 @deprecated(
@@ -139,9 +138,8 @@ def test(word_idx):
    :return: Test reader creator
    :rtype: callable
    """
-    return reader_creator(
+    return reader_creator(re.compile(r"aclImdb/test/pos/.*\.txt$"),
-        re.compile(r"aclImdb/test/pos/.*\.txt$"),
+                          re.compile(r"aclImdb/test/neg/.*\.txt$"), word_idx)
-        re.compile(r"aclImdb/test/neg/.*\.txt$"), word_idx)
 @deprecated(

--- a/python/paddle/dataset/imikolov.py
+++ b/python/paddle/dataset/imikolov.py
@@ -83,6 +83,7 @@ def build_dict(min_word_freq=50):
 def reader_creator(filename, word_idx, n, data_type):
    def reader():
        with tarfile.open(
                paddle.dataset.common.download(

--- a/python/paddle/dataset/mnist.py
+++ b/python/paddle/dataset/mnist.py
@@ -41,6 +41,7 @@ TRAIN_LABEL_MD5 = 'd53e105ee54ea40749a09fcbcd1e9432'
 def reader_creator(image_filename, label_filename, buffer_size):
    def reader():
        with gzip.GzipFile(image_filename, 'rb') as image_file:
            img_buf = image_file.read()
@@ -61,8 +62,8 @@ def reader_creator(image_filename, label_filename, buffer_size):
                offset_lab = 0
                # label file : 8B
                magic_byte_lab = '>II'
-                magic_lab, label_num = struct.unpack_from(magic_byte_lab,
+                magic_lab, label_num = struct.unpack_from(
-                                                          lab_buf, offset_lab)
+                    magic_byte_lab, lab_buf, offset_lab)
                offset_lab += struct.calcsize(magic_byte_lab)
                while True:
@@ -76,8 +77,9 @@ def reader_creator(image_filename, label_filename, buffer_size):
                    fmt_images = '>' + str(buffer_size * rows * cols) + 'B'
                    images_temp = struct.unpack_from(fmt_images, img_buf,
                                                     offset_img)
-                    images = numpy.reshape(images_temp, (
+                    images = numpy.reshape(
-                        buffer_size, rows * cols)).astype('float32')
+                        images_temp,
+                        (buffer_size, rows * cols)).astype('float32')
                    offset_img += struct.calcsize(fmt_images)
                    images = images / 255.0

--- a/python/paddle/dataset/movielens.py
+++ b/python/paddle/dataset/movielens.py
@@ -89,8 +89,8 @@ class UserInfo(object):
    def __str__(self):
        return "<UserInfo id(%d), gender(%s), age(%d), job(%d)>" % (
-            self.index, "M"
+            self.index, "M" if self.is_male else "F", age_table[self.age],
-            if self.is_male else "F", age_table[self.age], self.job_id)
+            self.job_id)
    def __repr__(self):
        return str(self)
@@ -142,8 +142,10 @@ def __initialize_meta_info__():
                    for line in user_file:
                        line = cpt.to_text(line, encoding='latin')
                        uid, gender, age, job, _ = line.strip().split("::")
-                        USER_INFO[int(uid)] = UserInfo(
+                        USER_INFO[int(uid)] = UserInfo(index=uid,
-                            index=uid, gender=gender, age=age, job_id=job)
+                                                       gender=gender,
+                                                       age=age,
+                                                       job_id=job)
    return fn

--- a/python/paddle/dataset/tests/cifar_test.py
+++ b/python/paddle/dataset/tests/cifar_test.py
@@ -21,6 +21,7 @@ __all__ = []
 class TestCIFAR(unittest.TestCase):
    def check_reader(self, reader):
        sum = 0
        label = 0

--- a/python/paddle/dataset/tests/flowers_test.py
+++ b/python/paddle/dataset/tests/flowers_test.py
@@ -21,6 +21,7 @@ __all__ = []
 class TestFlowers(unittest.TestCase):
    def check_reader(self, reader):
        sum = 0
        label = 0

--- a/python/paddle/dataset/tests/imikolov_test.py
+++ b/python/paddle/dataset/tests/imikolov_test.py
@@ -23,6 +23,7 @@ __all__ = []
 class TestMikolov(unittest.TestCase):
    def check_reader(self, reader, n):
        for l in reader():
            self.assertEqual(len(l), n)

--- a/python/paddle/dataset/tests/mnist_test.py
+++ b/python/paddle/dataset/tests/mnist_test.py
@@ -21,6 +21,7 @@ __all__ = []
 class TestMNIST(unittest.TestCase):
    def check_reader(self, reader):
        sum = 0
        label = 0

--- a/python/paddle/dataset/tests/test_image.py
+++ b/python/paddle/dataset/tests/test_image.py
@@ -23,6 +23,7 @@ __all__ = []
 class Image(unittest.TestCase):
    def test_resize_flip_chw(self):
        # resize
        im = image.load_image('cat.jpg')

--- a/python/paddle/dataset/tests/voc2012_test.py
+++ b/python/paddle/dataset/tests/voc2012_test.py
@@ -21,6 +21,7 @@ __all__ = []
 class TestVOC(unittest.TestCase):
    def check_reader(self, reader):
        sum = 0
        label = 0

--- a/python/paddle/dataset/tests/wmt16_test.py
+++ b/python/paddle/dataset/tests/wmt16_test.py
@@ -21,6 +21,7 @@ __all__ = []
 class TestWMT16(unittest.TestCase):
    def checkout_one_sample(self, sample):
        # train data has 3 field: source language word indices,
        # target language word indices, and target next word indices.
@@ -38,22 +39,22 @@ class TestWMT16(unittest.TestCase):
    def test_train(self):
        for idx, sample in enumerate(
-                paddle.dataset.wmt16.train(
+                paddle.dataset.wmt16.train(src_dict_size=100000,
-                    src_dict_size=100000, trg_dict_size=100000)()):
+                                           trg_dict_size=100000)()):
            if idx >= 10: break
            self.checkout_one_sample(sample)
    def test_test(self):
        for idx, sample in enumerate(
-                paddle.dataset.wmt16.test(
+                paddle.dataset.wmt16.test(src_dict_size=1000,
-                    src_dict_size=1000, trg_dict_size=1000)()):
+                                          trg_dict_size=1000)()):
            if idx >= 10: break
            self.checkout_one_sample(sample)
    def test_val(self):
        for idx, sample in enumerate(
-                paddle.dataset.wmt16.validation(
+                paddle.dataset.wmt16.validation(src_dict_size=1000,
-                    src_dict_size=1000, trg_dict_size=1000)()):
+                                                trg_dict_size=1000)()):
            if idx >= 10: break
            self.checkout_one_sample(sample)

--- a/python/paddle/dataset/uci_housing.py
+++ b/python/paddle/dataset/uci_housing.py
@@ -73,8 +73,8 @@ def load_data(filename, feature_num=14, ratio=0.8):
    data = np.fromfile(filename, sep=' ')
    data = data.reshape(data.shape[0] // feature_num, feature_num)
-    maximums, minimums, avgs = data.max(axis=0), data.min(axis=0), data.sum(
+    maximums, minimums, avgs = data.max(axis=0), data.min(
-        axis=0) / data.shape[0]
+        axis=0), data.sum(axis=0) / data.shape[0]
    # if you want to print the distribution of input data, you could use function of feature_range
    #feature_range(maximums[:-1], minimums[:-1])
    for i in six.moves.range(feature_num - 1):
@@ -135,8 +135,10 @@ def test():
 def fluid_model():
-    parameter_tar = paddle.dataset.common.download(
+    parameter_tar = paddle.dataset.common.download(FLUID_URL_MODEL,
-        FLUID_URL_MODEL, 'uci_housing', FLUID_MD5_MODEL, 'fit_a_line.fluid.tar')
+                                                   'uci_housing',
+                                                   FLUID_MD5_MODEL,
+                                                   'fit_a_line.fluid.tar')
    tar = tarfile.TarFile(parameter_tar, mode='r')
    dirpath = tempfile.mkdtemp()

--- a/python/paddle/dataset/wmt14.py
+++ b/python/paddle/dataset/wmt14.py
@@ -50,6 +50,7 @@ UNK_IDX = 2
 def __read_to_dict(tar_file, dict_size):
    def __to_dict(fd, size):
        out_dict = dict()
        for line_count, line in enumerate(fd):
@@ -76,6 +77,7 @@ def __read_to_dict(tar_file, dict_size):
 def reader_creator(tar_file, file_name, dict_size):
    def reader():
        src_dict, trg_dict = __read_to_dict(tar_file, dict_size)
        with tarfile.open(tar_file, mode='r') as f:

--- a/python/paddle/dataset/wmt16.py
+++ b/python/paddle/dataset/wmt16.py
@@ -68,9 +68,9 @@ def __build_dict(tar_file, dict_size, save_path, lang):
        fout.write(
            cpt.to_bytes("%s\n%s\n%s\n" % (START_MARK, END_MARK, UNK_MARK)))
        for idx, word in enumerate(
-                sorted(
+                sorted(six.iteritems(word_dict),
-                    six.iteritems(word_dict), key=lambda x: x[1],
+                       key=lambda x: x[1],
-                    reverse=True)):
+                       reverse=True)):
            if idx + 3 == dict_size: break
            fout.write(cpt.to_bytes(word[0]))
            fout.write(cpt.to_bytes('\n'))
@@ -79,8 +79,8 @@ def __build_dict(tar_file, dict_size, save_path, lang):
 def __load_dict(tar_file, dict_size, lang, reverse=False):
    dict_path = os.path.join(paddle.dataset.common.DATA_HOME,
                             "wmt16/%s_%d.dict" % (lang, dict_size))
-    if not os.path.exists(dict_path) or (
+    if not os.path.exists(dict_path) or (len(open(dict_path, "rb").readlines())
-            len(open(dict_path, "rb").readlines()) != dict_size):
+                                         != dict_size):
        __build_dict(tar_file, dict_size, dict_path, lang)
    word_dict = {}
@@ -94,14 +94,15 @@ def __load_dict(tar_file, dict_size, lang, reverse=False):
 def __get_dict_size(src_dict_size, trg_dict_size, src_lang):
-    src_dict_size = min(src_dict_size, (TOTAL_EN_WORDS if src_lang == "en" else
+    src_dict_size = min(
-                                        TOTAL_DE_WORDS))
+        src_dict_size, (TOTAL_EN_WORDS if src_lang == "en" else TOTAL_DE_WORDS))
-    trg_dict_size = min(trg_dict_size, (TOTAL_DE_WORDS if src_lang == "en" else
+    trg_dict_size = min(
-                                        TOTAL_EN_WORDS))
+        trg_dict_size, (TOTAL_DE_WORDS if src_lang == "en" else TOTAL_EN_WORDS))
    return src_dict_size, trg_dict_size
 def reader_creator(tar_file, file_name, src_dict_size, trg_dict_size, src_lang):
    def reader():
        src_dict = __load_dict(tar_file, src_dict_size, src_lang)
        trg_dict = __load_dict(tar_file, trg_dict_size,
@@ -124,9 +125,9 @@ def reader_creator(tar_file, file_name, src_dict_size, trg_dict_size, src_lang):
                if len(line_split) != 2:
                    continue
                src_words = line_split[src_col].split()
-                src_ids = [start_id] + [
+                src_ids = [start_id
-                    src_dict.get(w, unk_id) for w in src_words
+                           ] + [src_dict.get(w, unk_id)
-                ] + [end_id]
+                                for w in src_words] + [end_id]
                trg_words = line_split[trg_col].split()
                trg_ids = [trg_dict.get(w, unk_id) for w in trg_words]
@@ -184,13 +185,12 @@ def train(src_dict_size, trg_dict_size, src_lang="en"):
    src_dict_size, trg_dict_size = __get_dict_size(src_dict_size, trg_dict_size,
                                                   src_lang)
-    return reader_creator(
+    return reader_creator(tar_file=paddle.dataset.common.download(
-        tar_file=paddle.dataset.common.download(DATA_URL, "wmt16", DATA_MD5,
+        DATA_URL, "wmt16", DATA_MD5, "wmt16.tar.gz"),
-                                                "wmt16.tar.gz"),
+                          file_name="wmt16/train",
-        file_name="wmt16/train",
+                          src_dict_size=src_dict_size,
-        src_dict_size=src_dict_size,
+                          trg_dict_size=trg_dict_size,
-        trg_dict_size=trg_dict_size,
+                          src_lang=src_lang)
-        src_lang=src_lang)
 @deprecated(
@@ -238,13 +238,12 @@ def test(src_dict_size, trg_dict_size, src_lang="en"):
    src_dict_size, trg_dict_size = __get_dict_size(src_dict_size, trg_dict_size,
                                                   src_lang)
-    return reader_creator(
+    return reader_creator(tar_file=paddle.dataset.common.download(
-        tar_file=paddle.dataset.common.download(DATA_URL, "wmt16", DATA_MD5,
+        DATA_URL, "wmt16", DATA_MD5, "wmt16.tar.gz"),
-                                                "wmt16.tar.gz"),
+                          file_name="wmt16/test",
-        file_name="wmt16/test",
+                          src_dict_size=src_dict_size,
-        src_dict_size=src_dict_size,
+                          trg_dict_size=trg_dict_size,
-        trg_dict_size=trg_dict_size,
+                          src_lang=src_lang)
-        src_lang=src_lang)
 @deprecated(
@@ -290,13 +289,12 @@ def validation(src_dict_size, trg_dict_size, src_lang="en"):
    src_dict_size, trg_dict_size = __get_dict_size(src_dict_size, trg_dict_size,
                                                   src_lang)
-    return reader_creator(
+    return reader_creator(tar_file=paddle.dataset.common.download(
-        tar_file=paddle.dataset.common.download(DATA_URL, "wmt16", DATA_MD5,
+        DATA_URL, "wmt16", DATA_MD5, "wmt16.tar.gz"),
-                                                "wmt16.tar.gz"),
+                          file_name="wmt16/val",
-        file_name="wmt16/val",
+                          src_dict_size=src_dict_size,
-        src_dict_size=src_dict_size,
+                          trg_dict_size=trg_dict_size,
-        trg_dict_size=trg_dict_size,
+                          src_lang=src_lang)
-        src_lang=src_lang)
 @deprecated(

--- a/python/paddle/device/__init__.py
+++ b/python/paddle/device/__init__.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-# TODO: define the functions to manipulate devices 
+# TODO: define the functions to manipulate devices
 import re
 import os
 from paddle.fluid import core

--- a/python/paddle/device/cuda/__init__.py
+++ b/python/paddle/device/cuda/__init__.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -178,8 +178,8 @@ def extract_cuda_device_id(device, op_name):
        else:
            raise ValueError(
                "The current string {} is not expected. Because {} only support string which is like 'gpu:x'. "
-                "Please input appropriate string again!".format(device,
+                "Please input appropriate string again!".format(
-                                                                op_name))
+                    device, op_name))
    else:
        raise ValueError(
            "The device type {} is not expected. Because {} only support int, str or paddle.CUDAPlace. "

--- a/python/paddle/device/cuda/graphs.py
+++ b/python/paddle/device/cuda/graphs.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -31,6 +31,7 @@ ALL_MODES = ["global", "thread_local", "relaxed"]
 class CUDAGraph:
    def __init__(self, place=None, mode="thread_local"):
        assert CoreCUDAGraph is not None, "CUDA Graph is only supported on PaddlePaddle compiled with NVIDIA GPU."
@@ -61,7 +62,7 @@ class CUDAGraph:
        assert os.path.isdir(
            dirname), "The dirname {} should be a directory".format(dirname)
        if flags is None:
-            flags = 2047  # only all information. It can be any integer inside [1, 2048)  
+            flags = 2047  # only all information. It can be any integer inside [1, 2048)
        self._graph.print_to_dot_files(dirname, flags)

--- a/python/paddle/device/cuda/streams.py
+++ b/python/paddle/device/cuda/streams.py
 # Copyright (c) 2021 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

--- a/python/paddle/distributed/__init__.py
+++ b/python/paddle/distributed/__init__.py
@@ -59,33 +59,33 @@ from . import utils  # noqa: F401
 from .sharding import *  # noqa: F401
 __all__ = [  # noqa
-      "spawn",
+    "spawn",
-      "launch",
+    "launch",
-      "scatter",
+    "scatter",
-      "broadcast",
+    "broadcast",
-      "ParallelEnv",
+    "ParallelEnv",
-      "new_group",
+    "new_group",
-      "init_parallel_env",
+    "init_parallel_env",
-      "gloo_init_parallel_env",
+    "gloo_init_parallel_env",
-      "gloo_barrier",
+    "gloo_barrier",
-      "gloo_release",
+    "gloo_release",
-      "QueueDataset",
+    "QueueDataset",
-      "split",
+    "split",
-      "CountFilterEntry",
+    "CountFilterEntry",
-      "ShowClickEntry",
+    "ShowClickEntry",
-      "get_world_size",
+    "get_world_size",
-      "get_group",
+    "get_group",
-      "all_gather",
+    "all_gather",
-      "InMemoryDataset",
+    "InMemoryDataset",
-      "barrier",
+    "barrier",
-      "all_reduce",
+    "all_reduce",
-      "alltoall",
+    "alltoall",
-      "send",
+    "send",
-      "reduce",
+    "reduce",
-      "recv",
+    "recv",
-      "ReduceOp",
+    "ReduceOp",
-      "wait",
+    "wait",
-      "get_rank",
+    "get_rank",
-      "ProbabilityEntry",
+    "ProbabilityEntry",
-      "ParallelMode",
+    "ParallelMode",
 ]
--- a/python/paddle/distributed/auto_parallel/cluster.py
+++ b/python/paddle/distributed/auto_parallel/cluster.py
@@ -50,14 +50,14 @@ class Device:
        self._local_id = local_id
        self._machine = machine
        self._type = None
-        # Different device have different models, such as 
+        # Different device have different models, such as
        # "Tesla V100-SXM2-32GB" and "A100-SXM4-40GB" etc.
        self._model = None
        # Double precision GFLOPS
        self._dp_gflops = None
        # Single precision GFLOPS
        self._sp_gflops = None
-        # Memory is stored by GB 
+        # Memory is stored by GB
        self._memory = None
    @property
@@ -144,9 +144,9 @@ class Link:
        self._src = source
        self._tgt = target
        self._type = None
-        # bandwidth is stored by GB/s 
+        # bandwidth is stored by GB/s
        self._bandwidth = None
-        # latency is stored by millisecond 
+        # latency is stored by millisecond
        self._latency = None
        self._hop = None
@@ -210,6 +210,7 @@ class Link:
 class Machine:
    def __init__(self, id):
        self._id = id
        self._hostname = None
@@ -290,6 +291,7 @@ class Machine:
 class AlphaLatency:
    def __init__(self, alpha_latency):
        assert isinstance(alpha_latency, dict)
        self._base = alpha_latency.get("base", None)

--- a/python/paddle/distributed/auto_parallel/completion.py
+++ b/python/paddle/distributed/auto_parallel/completion.py
@@ -137,6 +137,7 @@ def _validate_dims_mapping(dims_mapping, process_mesh):
 class Completer:
    def __init__(self, dist_context):
        assert dist_context is not None
        self._dist_context = dist_context
@@ -248,8 +249,8 @@ class Completer:
                                tensor_desc.name(), compatible_dims_mapping)
                            changed = True
            # Find the most compatible implemenetations from the distributed operator
-            op_dist_impls = find_compatible_distributed_operator_impls(
+            op_dist_impls = find_compatible_distributed_operator_impls(dist_op,
-                dist_op, fwd=True)
+                                                                       fwd=True)
            if op_dist_impls is not None:
                not_compatible = True
                backup_op_dist_attr = copy.deepcopy(op_dist_attr)
@@ -451,6 +452,7 @@ class Completer:
                    tensor_dist_attr.process_mesh = compatible_process_mesh
    def _update_process_mesh_for_specials(self):
        def _find_nearest_tensor_node_before(nodes, idx, var_name):
            for node in reversed(nodes[:idx]):
                if node.is_var() and node.var() is not None \
@@ -694,8 +696,8 @@ class Completer:
        # Step 2.2: set the process meshes of ops by the nearest op node after the first op node
        if idx_of_first_op_node_has_process_mesh + 1 > len(ordered_op_nodes):
            return None
-        for idx, op_node in enumerate(ordered_op_nodes[
+        for idx, op_node in enumerate(
-                idx_of_first_op_node_has_process_mesh + 1:]):
+                ordered_op_nodes[idx_of_first_op_node_has_process_mesh + 1:]):
            original_idx = idx_of_first_op_node_has_process_mesh + idx + 1
            nearest_op_node = ordered_op_nodes[original_idx - 1]
            nearest_op_dist_attr = self._dist_context.get_dist_attr_for_graph(
@@ -831,9 +833,9 @@ class Completer:
            if grad_op.desc.original_id(
            ) in dist_op_context.grad_op_id_to_op_id:
                # TODO support the case where one forward op corresponding to multiple xxx_grad op
-                forward_op = _get_op_by_id(ops,
+                forward_op = _get_op_by_id(
-                                           dist_op_context.grad_op_id_to_op_id[
+                    ops, dist_op_context.grad_op_id_to_op_id[
-                                               grad_op.desc.original_id()])
+                        grad_op.desc.original_id()])
                assert forward_op is not None
                fwd_op_dist_attr = self._dist_context.get_op_dist_attr_for_program(
@@ -862,8 +864,8 @@ class Completer:
                                input_name)
                    assert ref_dims_mapping is not None, "[{}] 's dims mapping is NONE".format(
                        input_name)
-                    grad_op_dist_attr.set_input_dims_mapping(input_name,
+                    grad_op_dist_attr.set_input_dims_mapping(
-                                                             ref_dims_mapping)
+                        input_name, ref_dims_mapping)
                for output_name in grad_op.output_arg_names:
                    assert output_name in grad_var_to_var[appended_grad_times]
@@ -878,8 +880,8 @@ class Completer:
                    self._dist_context.set_tensor_dist_attr_for_program(
                        output_var, tensor_dist_attr)
                    # op
-                    grad_op_dist_attr.set_output_dims_mapping(output_name,
+                    grad_op_dist_attr.set_output_dims_mapping(
-                                                              ref_dims_mapping)
+                        output_name, ref_dims_mapping)
                self._dist_context.set_op_dist_attr_for_program(
                    grad_op, grad_op_dist_attr)
@@ -934,10 +936,10 @@ class Completer:
                    # op
                    grad_op_dist_attr = OperatorDistributedAttribute()
                    grad_op_dist_attr.process_mesh = ref_process_mesh
-                    grad_op_dist_attr.set_input_dims_mapping(ref_var_name,
+                    grad_op_dist_attr.set_input_dims_mapping(
-                                                             ref_dims_mapping)
+                        ref_var_name, ref_dims_mapping)
-                    grad_op_dist_attr.set_output_dims_mapping(output_var_name,
+                    grad_op_dist_attr.set_output_dims_mapping(
-                                                              ref_dims_mapping)
+                        output_var_name, ref_dims_mapping)
                elif grad_op.type in ['shape', 'fill_constant']:
                    continue
@@ -977,8 +979,8 @@ class Completer:
        first_backward_op_idx = -1
        for idx, op in enumerate(serial_main_program.global_block().ops):
            if int(op.attr('op_role')) == int(
-                    int(core.op_proto_and_checker_maker.OpRole.Backward) | int(
+                    int(core.op_proto_and_checker_maker.OpRole.Backward)
-                        core.op_proto_and_checker_maker.OpRole.Loss)):
+                    | int(core.op_proto_and_checker_maker.OpRole.Loss)):
                assert op.type == "fill_constant"
                first_backward_op_idx = idx
                break
@@ -1025,8 +1027,8 @@ class Completer:
                op_dist_attr.process_mesh = process_mesh
                op_dist_attr.set_output_dims_mapping(grad_var.name,
                                                     dims_mapping)
-                self._dist_context.set_op_dist_attr_for_program(ops[idx],
+                self._dist_context.set_op_dist_attr_for_program(
-                                                                op_dist_attr)
+                    ops[idx], op_dist_attr)
                continue
            # complete the annotation of grad op (xxx_grad op or sum op)
@@ -1035,9 +1037,10 @@ class Completer:
            if grad_op.desc.original_id(
            ) in dist_op_context.grad_op_id_to_op_id:
                # TODO support the case where one forward op corresponding to multiple xxx_grad op
-                forward_op = _get_op_by_id(ops[:first_backward_op_idx],
+                forward_op = _get_op_by_id(
-                                           dist_op_context.grad_op_id_to_op_id[
+                    ops[:first_backward_op_idx],
-                                               grad_op.desc.original_id()])
+                    dist_op_context.grad_op_id_to_op_id[
+                        grad_op.desc.original_id()])
                assert forward_op is not None
                if grad_op.type == "concat" and forward_op.type == "split":
@@ -1060,8 +1063,8 @@ class Completer:
                    self._dist_context.set_tensor_dist_attr_for_program(
                        output_var, output_var_dist_attr)
-                    grad_op_dist_attr.set_output_dims_mapping(output_var.name,
+                    grad_op_dist_attr.set_output_dims_mapping(
-                                                              ref_dims_mapping)
+                        output_var.name, ref_dims_mapping)
                    grad_op_dist_attr.process_mesh = ref_mesh
                    self._dist_context.set_op_dist_attr_for_program(
                        grad_op, grad_op_dist_attr)
@@ -1095,8 +1098,8 @@ class Completer:
                                input_name)
                    assert ref_dims_mapping is not None, "[{}] 's dims mapping is NONE".format(
                        input_name)
-                    grad_op_dist_attr.set_input_dims_mapping(input_name,
+                    grad_op_dist_attr.set_input_dims_mapping(
-                                                             ref_dims_mapping)
+                        input_name, ref_dims_mapping)
                for output_name in grad_op.output_arg_names:
                    assert output_name in grad_var_to_var
@@ -1111,8 +1114,8 @@ class Completer:
                    self._dist_context.set_tensor_dist_attr_for_program(
                        output_var, tensor_dist_attr)
                    # op
-                    grad_op_dist_attr.set_output_dims_mapping(output_name,
+                    grad_op_dist_attr.set_output_dims_mapping(
-                                                              ref_dims_mapping)
+                        output_name, ref_dims_mapping)
                grad_op_dist_attr.impl_type = fwd_op_dist_attr.impl_type
                grad_op_dist_attr.impl_idx = fwd_op_dist_attr.impl_idx
@@ -1170,10 +1173,10 @@ class Completer:
                    # op
                    grad_op_dist_attr = OperatorDistributedAttribute()
                    grad_op_dist_attr.process_mesh = ref_process_mesh
-                    grad_op_dist_attr.set_input_dims_mapping(ref_var_name,
+                    grad_op_dist_attr.set_input_dims_mapping(
-                                                             ref_dims_mapping)
+                        ref_var_name, ref_dims_mapping)
-                    grad_op_dist_attr.set_output_dims_mapping(output_var_name,
+                    grad_op_dist_attr.set_output_dims_mapping(
-                                                              ref_dims_mapping)
+                        output_var_name, ref_dims_mapping)
                else:
                    raise ValueError("got unexpect op [{}]".format(
@@ -1186,7 +1189,7 @@ class Completer:
        """Complete the annotation of vars and ops in the update phase for parallel program."""
        # Notice: serial_main_program is actually a dist_main_program of current rank,
-        # and must be passed into this function. 
+        # and must be passed into this function.
        # TODO: We should fix this behavior.
        ops = list(serial_main_program.global_block().ops)
@@ -1223,10 +1226,10 @@ class Completer:
                        op, op_dist_attr)
                if "Grad" in op.input_names and "Param" in ops[idx].input_names:
-                    assert len(op.input(
+                    assert len(
-                        "Param")) == 1, "Only support one-to-one now."
+                        op.input("Param")) == 1, "Only support one-to-one now."
-                    assert len(op.input(
+                    assert len(
-                        "Grad")) == 1, "Only support one-to-one now."
+                        op.input("Grad")) == 1, "Only support one-to-one now."
                    param = vars[op.input("Param")[0]]
                    grad_var = vars[op.input("Grad")[0]]
@@ -1245,12 +1248,12 @@ class Completer:
                                                        ref_dims_mapping)
                    op_dist_attr.set_input_dims_mapping(param.name,
                                                        ref_dims_mapping)
-                    op_dist_attr.set_output_dims_mapping(param.name,
+                    op_dist_attr.set_output_dims_mapping(
-                                                         ref_dims_mapping)
+                        param.name, ref_dims_mapping)
                    learning_var = vars[op.input("LearningRate")[0]]
                    op_dist_attr.set_input_dims_mapping(learning_var.name, [-1])
-                    op_dist_attr.set_output_dims_mapping(learning_var.name,
+                    op_dist_attr.set_output_dims_mapping(
-                                                         [-1])
+                        learning_var.name, [-1])
                    if not learning_rate_completed:
                        learning_rate_completed = True
@@ -1275,10 +1278,10 @@ class Completer:
                        if "Beta1Pow" in input_name or "Beta2Pow" in input_name:
                            input_var_attr.dims_mapping = [-1]
-                            op_dist_attr.set_input_dims_mapping(input_var.name,
+                            op_dist_attr.set_input_dims_mapping(
-                                                                [-1])
+                                input_var.name, [-1])
-                            op_dist_attr.set_output_dims_mapping(input_var.name,
+                            op_dist_attr.set_output_dims_mapping(
-                                                                 [-1])
+                                input_var.name, [-1])
                        else:
                            assert "Moment" in input_name
                            input_var_attr.dims_mapping = ref_dims_mapping

--- a/python/paddle/distributed/auto_parallel/converter.py
+++ b/python/paddle/distributed/auto_parallel/converter.py
@@ -133,8 +133,9 @@ class Converter(object):
                tensors_dict[tensor_name] = Converter.merge_and_slice(
                    tensor_list, pre_dist_attr, cur_dist_attr)
            except ValueError as err:
-                raise ValueError("Fail to convert tensor '{}'. "
+                raise ValueError(
-                                 .format(str(tensor_name)) + str(err))
+                    "Fail to convert tensor '{}'. ".format(str(tensor_name)) +
+                    str(err))
        for tensor_name in self._pre_strategy:
            if tensor_name not in self._cur_strategy:
@@ -150,17 +151,17 @@ class Converter(object):
        tensor_not_in_cur = set(tensor_not_in_cur) - set(tensor_match_with_cur)
        if tensor_not_in_pre:
            warnings.warn(
-                "tensors [{}] are not found in last training strategy."
+                "tensors [{}] are not found in last training strategy.".format(
-                .format(str(tensor_not_in_pre)))
+                    str(tensor_not_in_pre)))
        if tensor_not_in_cur:
            warnings.warn(
-                "tensors [{}] are not found in current training strategy."
+                "tensors [{}] are not found in current training strategy.".
-                .format(str(tensor_not_in_cur)))
+                format(str(tensor_not_in_cur)))
        if tensor_not_in_ckpt:
            warnings.warn(
                "tensors [{}] are found in pre_strategy, but are not found"
-                "in checkpoint files, please check your checkpoint files."
+                "in checkpoint files, please check your checkpoint files.".
-                .format(str(tensor_not_in_ckpt)))
+                format(str(tensor_not_in_ckpt)))
        return tensors_dict
@@ -360,8 +361,9 @@ class Converter(object):
        """
        sliced_tensor_list = []
        axis = len(complete_tensor.shape) - length
-        sliced_tensor = np.split(
+        sliced_tensor = np.split(complete_tensor,
-            complete_tensor, partition_index_list[axis], axis=axis)
+                                 partition_index_list[axis],
+                                 axis=axis)
        if length == 1:
            return sliced_tensor
        for tensor in sliced_tensor:

--- a/python/paddle/distributed/auto_parallel/cost/base_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/base_cost.py
@@ -85,8 +85,8 @@ def _parse_op_to_desc(op, dist_context=None):
 def parse_to_desc(op=None, dist_op=None, dist_context=None):
    desc = None
    if op is None and dist_op is not None and dist_context is not None:
-        desc = _parse_op_to_desc(
+        desc = _parse_op_to_desc(op=dist_op.serial_op,
-            op=dist_op.serial_op, dist_context=dist_context)
+                                 dist_context=dist_context)
    elif op is not None and dist_op is None and dist_context is None:
        desc = _parse_op_to_desc(op)
@@ -94,6 +94,7 @@ def parse_to_desc(op=None, dist_op=None, dist_context=None):
 def parse_desc_to_str(desc):
    def _parse_dtype(dtype):
        dtype_str = ""
        if dtype == paddle.float32:
@@ -248,10 +249,10 @@ class CommContext:
        else:
            for i in range(len(ranks)):
                for j in range(i + 1, len(ranks)):
-                    forward_order_beta = self.cluster.get_beta(ranks[i],
+                    forward_order_beta = self.cluster.get_beta(
-                                                               ranks[j])
+                        ranks[i], ranks[j])
-                    backward_order_beta = self.cluster.get_beta(ranks[j],
+                    backward_order_beta = self.cluster.get_beta(
-                                                                ranks[i])
+                        ranks[j], ranks[i])
                    beta = forward_order_beta if forward_order_beta > backward_order_beta else backward_order_beta
                    if max_beta == None:
                        max_beta = beta
@@ -275,6 +276,7 @@ class CommContext:
 class Cost:
    def __init__(self, time=0, memory=0, flops=0):
        self.time = time
        self.memory = memory
@@ -338,6 +340,7 @@ class Cost:
 class OpCost:
    def __init__(self, op=None, op_desc=None):
        self._op = op
        self._op_desc = op_desc
@@ -462,8 +465,8 @@ class CommOpCost(OpCost):
            elif dtype == paddle.float16:
                factor = 2
            else:
-                raise TypeError("This dtype {} is not supported now".format(
+                raise TypeError(
-                    dtype))
+                    "This dtype {} is not supported now".format(dtype))
            comm_count = reduce(lambda x, y: x * y, shape) * factor
            self._comm_count = comm_count
@@ -506,8 +509,9 @@ class CommOpCost(OpCost):
    def _check_comm_op_type(cls):
        if cls.OP_TYPE != "COMM":
            if cls.OP_TYPE not in COMM_OP_TYPE:
-                raise TypeError("Please Check op type in {}, but got {}.".
+                raise TypeError(
-                                format(COMM_OP_TYPE, cls.OP_TYPE))
+                    "Please Check op type in {}, but got {}.".format(
+                        COMM_OP_TYPE, cls.OP_TYPE))
 class CompOpCost(OpCost):
@@ -523,8 +527,9 @@ class CompOpCost(OpCost):
    def _check_comp_op_type(cls):
        if cls.OP_TYPE != "COMP":
            if cls.OP_TYPE in NON_COMP_TYPE:
-                raise TypeError("Please Check op type not in {}, but got {}.".
+                raise TypeError(
-                                format(NON_COMP_TYPE, cls.OP_TYPE))
+                    "Please Check op type not in {}, but got {}.".format(
+                        NON_COMP_TYPE, cls.OP_TYPE))
 def register_op_cost(cls):

--- a/python/paddle/distributed/auto_parallel/cost/comm_op_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/comm_op_cost.py
@@ -22,8 +22,9 @@ class AllreduceSumOpCost(CommOpCost):
    OP_TYPE = "c_allreduce_sum"
    def __init__(self, op=None, op_desc=None, comm_context=None):
-        super(AllreduceSumOpCost, self).__init__(
+        super(AllreduceSumOpCost, self).__init__(op=op,
-            op=op, op_desc=op_desc, comm_context=comm_context)
+                                                 op_desc=op_desc,
+                                                 comm_context=comm_context)
    def calc_time(self):
        # use tree if cross machine and use ring if in a single machine
@@ -38,20 +39,20 @@ class AllreduceSumOpCost(CommOpCost):
    def calc_time_ring(self):
        alpha = self.comm_context.base_ring
-        alpha += 2 * (
+        alpha += 2 * (self.rank_count -
-            self.rank_count - self.machine_count) * self.comm_context.intra_ring
+                      self.machine_count) * self.comm_context.intra_ring
        alpha += 2 * (self.machine_count - 1) * (
            self.comm_context.inter_ring + self.hops * self.comm_context.switch)
        beta = self.comm_context.get_max_beta(self.group_ranks)
-        time = alpha + 2 * (self.rank_count - 1
+        time = alpha + 2 * (self.rank_count -
-                            ) / self.rank_count * self.comm_count * beta
+                            1) / self.rank_count * self.comm_count * beta
        return time
    def calc_time_tree(self):
        alpha = self.comm_context.base_tree
-        alpha += 2 * (self.rank_count / self.machine_count - 1
+        alpha += 2 * (self.rank_count / self.machine_count -
-                      ) * self.comm_context.intra_tree
+                      1) * self.comm_context.intra_tree
        alpha += math.log2(self.machine_count) * (
            self.comm_context.inter_tree + self.hops * self.comm_context.switch)
        beta = self.comm_context.get_max_beta(self.group_ranks)
@@ -66,8 +67,9 @@ class AllgatherOpCost(CommOpCost):
    OP_TYPE = "c_allgather"
    def __init__(self, op=None, op_desc=None, comm_context=None):
-        super(AllgatherOpCost, self).__init__(
+        super(AllgatherOpCost, self).__init__(op=op,
-            op=op, op_desc=op_desc, comm_context=comm_context)
+                                              op_desc=op_desc,
+                                              comm_context=comm_context)
    def calc_time(self):
        time = self.calc_time_ring()
@@ -75,13 +77,13 @@ class AllgatherOpCost(CommOpCost):
    def calc_time_ring(self):
        alpha = self.comm_context.base_ring
-        alpha += (
+        alpha += (self.rank_count -
-            self.rank_count - self.machine_count) * self.comm_context.intra_ring
+                  self.machine_count) * self.comm_context.intra_ring
        alpha += (self.machine_count - 1) * (
            self.comm_context.inter_ring + self.hops * self.comm_context.switch)
        beta = self.comm_context.get_max_beta(self.group_ranks)
-        time = alpha + (self.rank_count - 1
+        time = alpha + (self.rank_count -
-                        ) / self.rank_count * self.comm_count * beta
+                        1) / self.rank_count * self.comm_count * beta
        return time
@@ -90,8 +92,9 @@ class BroadcastOpCost(CommOpCost):
    OP_TYPE = "c_broadcast"
    def __init__(self, op=None, op_desc=None, comm_context=None):
-        super(BroadcastOpCost, self).__init__(
+        super(BroadcastOpCost, self).__init__(op=op,
-            op=op, op_desc=op_desc, comm_context=comm_context)
+                                              op_desc=op_desc,
+                                              comm_context=comm_context)
    def calc_time(self):
        time = self.calc_time_ring()
@@ -114,8 +117,9 @@ class IdentityOpCost(CommOpCost):
    OP_TYPE = "c_identity"
    def __init__(self, op=None, op_desc=None, comm_context=None):
-        super(IdentityOpCost, self).__init__(
+        super(IdentityOpCost, self).__init__(op=op,
-            op=op, op_desc=op_desc, comm_context=comm_context)
+                                             op_desc=op_desc,
+                                             comm_context=comm_context)
    def calc_time(self):
        return 0
@@ -126,8 +130,9 @@ class RecvOpCost(CommOpCost):
    OP_TYPE = "recv_v2"
    def __init__(self, op=None, op_desc=None, comm_context=None):
-        super(RecvOpCost, self).__init__(
+        super(RecvOpCost, self).__init__(op=op,
-            op=op, op_desc=op_desc, comm_context=comm_context)
+                                         op_desc=op_desc,
+                                         comm_context=comm_context)
    def calc_time(self):
        alpha = self.comm_context.base_ring
@@ -145,8 +150,9 @@ class SendOpCost(CommOpCost):
    OP_TYPE = "send_v2"
    def __init__(self, op=None, op_desc=None, comm_context=None):
-        super(SendOpCost, self).__init__(
+        super(SendOpCost, self).__init__(op=op,
-            op=op, op_desc=op_desc, comm_context=comm_context)
+                                         op_desc=op_desc,
+                                         comm_context=comm_context)
    def calc_time(self):
        alpha = self.comm_context.base_ring

--- a/python/paddle/distributed/auto_parallel/cost/comp_op_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/comp_op_cost.py
--- a/python/paddle/distributed/auto_parallel/cost/estimate_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/estimate_cost.py
@@ -14,6 +14,7 @@
 class CostEstimator:
    def __init__(self,
                 program,
                 cluster=None,

--- a/python/paddle/distributed/auto_parallel/cost/tensor_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/tensor_cost.py
@@ -22,6 +22,7 @@ from .base_cost import Cost
 class TensorCost:
    def __init__(self, tensor=None, dist_tensor=None, shape=None, dtype=None):
        self._check_args(tensor, dist_tensor, shape, dtype)
        self._tensor = tensor
@@ -59,20 +60,20 @@ class TensorCost:
            assert (tensor is None and shape is None)
            if not isinstance(dist_tensor, DistributedTensor):
                raise TypeError(
-                    "Please check dist_tensor type is DistributedTensor, but got {}".
+                    "Please check dist_tensor type is DistributedTensor, but got {}"
-                    format(type(dist_tensor)))
+                    .format(type(dist_tensor)))
        elif shape is not None:
-            assert (tensor is None and dist_tensor is None and
+            assert (tensor is None and dist_tensor is None
-                    dtype is not None)
+                    and dtype is not None)
            if not isinstance(shape, (list, set)):
                raise TypeError(
                    "Please check shape type is list or set, but got {}".format(
                        type(shape)))
        elif dtype is not None:
-            assert (tensor is None and dist_tensor is None and
+            assert (tensor is None and dist_tensor is None
-                    shape is not None)
+                    and shape is not None)
    @property
    def cost(self):

--- a/python/paddle/distributed/auto_parallel/cost_model.py
+++ b/python/paddle/distributed/auto_parallel/cost_model.py
@@ -37,6 +37,7 @@ class CostNodeType(Enum):
 class Cost(object):
    def __init__(self):
        self.runtime = None
        self.static_mem = None
@@ -51,6 +52,7 @@ class CostModelMode(Enum):
 class CostNode(object):
    def __init__(self, node, node_type, id=None):
        self.id = id
        self.node = node
@@ -71,6 +73,7 @@ class CostNode(object):
 class MergedOpsCostNode(CostNode):
    def __init__(self, node_type, id=None, base_node_list=None, is_bwd=False):
        super(MergedOpsCostNode, self).__init__(None, node_type, id)
        self.node_list = base_node_list
@@ -78,6 +81,7 @@ class MergedOpsCostNode(CostNode):
 class CommOpCostNode(CostNode):
    def __init__(self,
                 node,
                 node_type,
@@ -118,6 +122,7 @@ class CommOpCostNode(CostNode):
 class TensorCostNode(CostNode):
    def __init__(self,
                 node,
                 node_type,
@@ -159,6 +164,7 @@ class TensorCostNode(CostNode):
 class CompOpCostNode(CostNode):
    def __init__(self, node, node_type, id=None, is_bwd=False, is_optim=False):
        super(CompOpCostNode, self).__init__(node, node_type, id)
        self.is_bwd = is_bwd
@@ -174,6 +180,7 @@ class CompOpCostNode(CostNode):
 class PipeEvent(object):
    def __init__(self, stage_id, event_name, duration, start_time=-1):
        self.stage_id = stage_id
        self.name = event_name
@@ -183,6 +190,7 @@ class PipeEvent(object):
 class CostModel(object):
    def __init__(self,
                 mode=CostModelMode.BENCHMARKING,
                 cluster=None,
@@ -261,8 +269,8 @@ class CostModel(object):
                op_node = CommOpCostNode(op, CostNodeType.COMMUNICATION, op_id,
                                         is_bwd)
            else:
-                is_bwd = (int(op.attr('op_role')) == int(OpRole.Backward)
+                is_bwd = (int(op.attr('op_role')) == int(
-                          ) or "@GRAD" in op.input_arg_names
+                    OpRole.Backward)) or "@GRAD" in op.input_arg_names
                is_optim = 'LearningRate' in op.input_names
                op_node = CompOpCostNode(op, CostNodeType.COMPUTATION, op_id,
                                         is_bwd, is_optim)
@@ -310,11 +318,10 @@ class CostModel(object):
                        write_op_cnt += 1
                        new_var_id = node_id + '_write_{}'.format(write_op_cnt)
-                        new_var = TensorCostNode(
+                        new_var = TensorCostNode(node.node,
-                            node.node,
+                                                 CostNodeType.VARIABLE,
-                            CostNodeType.VARIABLE,
+                                                 new_var_id,
-                            new_var_id,
+                                                 shared_node_id=node_id)
-                            shared_node_id=node_id)
                        graph[new_var_id] = [[], []]
                        graph[pred_id][SUCC].append(new_var_id)
@@ -341,8 +348,8 @@ class CostModel(object):
            self.runtime_graph.append({})
            self._parse_sub_program(
                sub_prog, self.nodes[sub_idx], self.origin_graph[sub_idx],
-                self.cost_data[0 if self.rank2pp is None else self.rank2pp[
+                self.cost_data[0 if self.rank2pp is None else self.
-                    sub_idx]], sub_idx)
+                               rank2pp[sub_idx]], sub_idx)
        return self.nodes
    def _find_succ_op(self, node_id, sub_idx=0):
@@ -417,11 +424,10 @@ class CostModel(object):
                        merge_type))
        merged_node_id = 'merged_' + str(len(nodes))
        is_bwd = to_merge_node_list[0].is_bwd
-        merged_node = MergedOpsCostNode(
+        merged_node = MergedOpsCostNode(CostNodeType.MERGED,
-            CostNodeType.MERGED,
+                                        id=merged_node_id,
-            id=merged_node_id,
+                                        base_node_list=nodes_list,
-            base_node_list=nodes_list,
+                                        is_bwd=is_bwd)
-            is_bwd=is_bwd)
        merged_node.cost = node_cost
        return merged_node_id, merged_node
@@ -435,10 +441,12 @@ class CostModel(object):
        '''
        cnt = 0
        for sub_idx in range(self.total_rank):
-            cnt += self._merge_linear(
+            cnt += self._merge_linear(self.nodes[sub_idx],
-                self.nodes[sub_idx], self.runtime_graph[sub_idx], is_bwd=False)
+                                      self.runtime_graph[sub_idx],
-            cnt += self._merge_linear(
+                                      is_bwd=False)
-                self.nodes[sub_idx], self.runtime_graph[sub_idx], is_bwd=True)
+            cnt += self._merge_linear(self.nodes[sub_idx],
+                                      self.runtime_graph[sub_idx],
+                                      is_bwd=True)
        return cnt
    def merge_branch(self):
@@ -454,10 +462,12 @@ class CostModel(object):
        '''
        cnt = 0
        for sub_idx in range(self.total_rank):
-            cnt += self._merge_branch(
+            cnt += self._merge_branch(self.nodes[sub_idx],
-                self.nodes[sub_idx], self.runtime_graph[sub_idx], is_bwd=False)
+                                      self.runtime_graph[sub_idx],
-            cnt += self._merge_branch(
+                                      is_bwd=False)
-                self.nodes[sub_idx], self.runtime_graph[sub_idx], is_bwd=True)
+            cnt += self._merge_branch(self.nodes[sub_idx],
+                                      self.runtime_graph[sub_idx],
+                                      is_bwd=True)
        return cnt
    def _merge_linear(self, nodes, runtime_graph, is_bwd=False):
@@ -482,8 +492,8 @@ class CostModel(object):
                # delete edges and add new edges
                succ = None
                try:
-                    runtime_graph[merged_node_id][SUCC] = copy.deepcopy(edges[
+                    runtime_graph[merged_node_id][SUCC] = copy.deepcopy(
-                        SUCC])
+                        edges[SUCC])
                    if len(runtime_graph[pred_id][SUCC]) > 1:
                        # predecessor has more than 1 successor
@@ -558,8 +568,8 @@ class CostModel(object):
                to_merge = True
                try:
-                    if len(edges[SUCC]) < 1 or len(runtime_graph[edges[SUCC][0]]
+                    if len(edges[SUCC]) < 1 or len(
-                                                   [SUCC]) < 1:
+                            runtime_graph[edges[SUCC][0]][SUCC]) < 1:
                        continue
                except:
                    continue
@@ -596,6 +606,7 @@ class CostModel(object):
        return reduct_cnt
    def get_runtime_cost(self):
        def get_node_cost(node):
            node_cost = node.cost + self.opcall_overhead
            if isinstance(node, MergedOpsCostNode):
@@ -660,8 +671,8 @@ class CostModel(object):
                    static_mem += size
                cur_mem += size
            edges = sim_graph[node_id]
-            if not (node.type == CostNodeType.VARIABLE and
+            if not (node.type == CostNodeType.VARIABLE
-                    node.node.persistable):
+                    and node.node.persistable):
                for succ_id in edges[SUCC]:
                    sim_graph[succ_id][PRED].remove(node_id)
                    if len(sim_graph[succ_id][PRED]) == 0:
@@ -670,8 +681,8 @@ class CostModel(object):
                pred = nodes
                if pred.type == CostNodeType.VARIABLE:
                    sim_graph[pred_id][SUCC].remove(node_id)
-                    if len(sim_graph[pred_id][
+                    if len(sim_graph[pred_id]
-                            SUCC]) == 0 and not pred.node.persistable:
+                           [SUCC]) == 0 and not pred.node.persistable:
                        cur_mem -= pred.get_size()
        return static_mem, cur_mem, top_mem
@@ -703,18 +714,16 @@ class CostModel(object):
                    event_list.append(e)
                    if stid != stage_num - 1:
                        q.put(
-                            PipeEvent(
+                            PipeEvent(stid + 1,
-                                stid + 1,
+                                      'fwd',
-                                'fwd',
+                                      self.fwd_time[stid + 1],
-                                self.fwd_time[stid + 1],
+                                      start_time=e.e_time))
-                                start_time=e.e_time))
                    else:
                        q.put(
-                            PipeEvent(
+                            PipeEvent(stid,
-                                stid,
+                                      'bwd',
-                                'bwd',
+                                      self.bwd_time[stid],
-                                self.bwd_time[stid],
+                                      start_time=e.e_time))
-                                start_time=e.e_time))
                    fwd_cnt[stid] -= 1
                    global_time[stid] = e.e_time
                else:
@@ -725,20 +734,18 @@ class CostModel(object):
                event_list.append(e)
                if stid != 0:
                    q.put(
-                        PipeEvent(
+                        PipeEvent(stid - 1,
-                            stid - 1,
+                                  'bwd',
-                            'bwd',
+                                  self.bwd_time[stid - 1],
-                            self.bwd_time[stid - 1],
+                                  start_time=e.e_time))
-                            start_time=e.e_time))
                fwd_cnt[stid] += 1
                bwd_cnt[stid] -= 1
                if bwd_cnt[stid] == 0:
                    q.put(
-                        PipeEvent(
+                        PipeEvent(stid,
-                            stid,
+                                  'optim',
-                            'optim',
+                                  self.optim_time[stid],
-                            self.optim_time[stid],
+                                  start_time=e.e_time))
-                            start_time=e.e_time))
                global_time[stid] = e.e_time
            elif e.name == 'optim':
                e.s_time = max(global_time[stid], e.s_time)
@@ -792,11 +799,10 @@ def estimate_cost(distributed_program, cluster, pipeline_config,
    """
    # the following line is left for now, cluster model will be involved in the future
    assert cluster is None, "For now, cluster remains None"
-    cm_ctx = CostModel(
+    cm_ctx = CostModel(cluster=cluster,
-        cluster=cluster,
+                       batch_size=batch_size,
-        batch_size=batch_size,
+                       standalone_cost_data=standalone_cost_data,
-        standalone_cost_data=standalone_cost_data,
+                       pipeline_config=pipeline_config)
-        pipeline_config=pipeline_config)
    cm_ctx.init(distributed_program)
    cost = cm_ctx.get_cost()
    return cost
--- a/python/paddle/distributed/auto_parallel/dist_attribute.py
+++ b/python/paddle/distributed/auto_parallel/dist_attribute.py
@@ -51,6 +51,7 @@ def append_op_output_suffix(name):
 class TensorDistributedAttribute:
    def __init__(self):
        # The process mesh of distributed operator attribute must is the same as
        # the process meshes of all input and output distributed attributed
@@ -123,8 +124,8 @@ class TensorDistributedAttribute:
                            key, dist_attr)
        elif isinstance(dist_attr, TensorDistributedAttribute):
            for key in get_tensor_dist_attr_field_keys():
-                field_property = TensorDistributedAttribute.__dict__.get(key,
+                field_property = TensorDistributedAttribute.__dict__.get(
-                                                                         None)
+                    key, None)
                if field_property:
                    field_property.fset(self, field_property.fget(dist_attr))
                else:
@@ -192,6 +193,7 @@ class TensorDistributedAttribute:
 class OperatorDistributedAttribute:
    def __init__(self):
        self._process_mesh = None
        self._op_type = None
@@ -356,8 +358,8 @@ class OperatorDistributedAttribute:
                    tensor_name, dist_attr.get_output_dist_attr(tensor_name))
            self._is_annotated = copy.deepcopy(dist_attr._is_annotated)
            for key in get_op_dist_attr_field_keys():
-                field_property = OperatorDistributedAttribute.__dict__.get(key,
+                field_property = OperatorDistributedAttribute.__dict__.get(
-                                                                           None)
+                    key, None)
                if field_property:
                    field_property.fset(self, field_property.fget(dist_attr))
                else:

--- a/python/paddle/distributed/auto_parallel/dist_context.py
+++ b/python/paddle/distributed/auto_parallel/dist_context.py
@@ -203,8 +203,8 @@ class DistributedContext:
            self._serial_main_program.clone())
        self._backup_serial_startup_program_stack.append(
            self._serial_startup_program.clone())
-        self._backup_pass_context_stack.append(
+        self._backup_pass_context_stack.append(copy.deepcopy(
-            copy.deepcopy(self._pass_context))
+            self._pass_context))
        self._backup_block_state_stack.append(copy.deepcopy(self._block_state))
    def _backup_dist_info(self, mode):
@@ -398,8 +398,8 @@ class DistributedContext:
            return dist_tensor
        else:
            serial_tensor_id = serial_tensor.desc.original_id()
-            dist_tensor = self._dist_tensors_for_program.get(serial_tensor_id,
+            dist_tensor = self._dist_tensors_for_program.get(
-                                                             None)
+                serial_tensor_id, None)
            if dist_tensor:
                return dist_tensor
            else:
@@ -438,8 +438,8 @@ class DistributedContext:
            return dist_tensor.dist_attr
        else:
            serial_tensor_id = serial_tensor.desc.original_id()
-            dist_tensor = self._dist_tensors_for_program.get(serial_tensor_id,
+            dist_tensor = self._dist_tensors_for_program.get(
-                                                             None)
+                serial_tensor_id, None)
            if dist_tensor:
                return dist_tensor.dist_attr
            else:
@@ -548,6 +548,7 @@ class DistributedContext:
            self._dist_ops_for_program)
    def _order_nodes_by_program_order(self):
        def _contains(nodes, target_node):
            for node in nodes:
                if _node_id(node) == _node_id(target_node):
@@ -719,8 +720,8 @@ class DistributedContext:
        # here we just set there process_mesh to the first one.
        for orphan_node in self._serial_orphan_tensor_nodes:
            serial_tensor_id = orphan_node.var().id()
-            dist_tensor = self._dist_tensors_for_program.get(serial_tensor_id,
+            dist_tensor = self._dist_tensors_for_program.get(
-                                                             None)
+                serial_tensor_id, None)
            if dist_tensor:
                dist_tensor.dist_attr.process_mesh = self._process_meshes[0]
            else:
@@ -807,11 +808,10 @@ class DistributedContext:
                assert dist_tensor is not None, \
                    "Tensor {} does not have a distributed attribute.".format(
                        dist_tensor.serial_tensor.name)
-                if (dist_tensor is not None) and (
+                if (dist_tensor
-                        not dist_tensor.validate_dist_attr()):
+                        is not None) and (not dist_tensor.validate_dist_attr()):
                    assert False, "Tensor {} (id: {}, original_id: {}) has a wrong distributed attributes {}.".format(
-                        dist_tensor.serial_tensor.name,
+                        dist_tensor.serial_tensor.name, dist_tensor.desc.id(),
-                        dist_tensor.desc.id(),
                        dist_tensor.desc.original_id(), dist_tensor.dist_attr)
            for op in block.ops:
                dist_op = self.get_dist_op_for_program(op)
@@ -820,8 +820,7 @@ class DistributedContext:
                        dist_op.serial_op.type)
                if (dist_op is not None) and (not dist_op.validate_dist_attr()):
                    assert False, "Operator {} (id: {}, original_id: {}) has a wrong distributed attributes {} .".format(
-                        dist_op.serial_op.type,
+                        dist_op.serial_op.type, dist_op.serial_op.desc.id(),
-                        dist_op.serial_op.desc.id(),
                        dist_op.serial_op.desc.original_id(), dist_op.dist_attr)
        return True
@@ -947,6 +946,7 @@ class DistributedOperatorContext:
 class BlockState(object):
    def __init__(self):
        self.nblock = 0
        self.forward_indices = []

--- a/python/paddle/distributed/auto_parallel/dist_loader.py
+++ b/python/paddle/distributed/auto_parallel/dist_loader.py
@@ -21,6 +21,7 @@ from paddle.io import DataLoader, DistributedBatchSampler
 class DistributedDataLoader(metaclass=abc.ABCMeta):
    def __init__(self,
                 dataset,
                 batch_size=1,
@@ -47,6 +48,7 @@ class DistributedDataLoader(metaclass=abc.ABCMeta):
 class NonIterableGeneratorLoader(DistributedDataLoader):
    def __init__(self,
                 dataset,
                 feed_list,
@@ -63,9 +65,10 @@ class NonIterableGeneratorLoader(DistributedDataLoader):
        self.dp_world_size = 1 if data_parallel_world_size is None else data_parallel_world_size
        self.dp_rank = 0 if data_parallel_rank is None else data_parallel_rank
-        super(NonIterableGeneratorLoader, self).__init__(
+        super(NonIterableGeneratorLoader,
-            dataset, batch_size, epochs, data_parallel_world_size,
+              self).__init__(dataset, batch_size, epochs,
-            data_parallel_rank, drop_last)
+                             data_parallel_world_size, data_parallel_rank,
+                             drop_last)
        self._inner_dataloader = self._create_inner_dataloader()
        self._steps = self._infer_steps()
@@ -96,6 +99,7 @@ class NonIterableGeneratorLoader(DistributedDataLoader):
        return steps_per_epoch
    def _create_inner_dataloader(self):
        def sample_data_generator():
            batch_data = None
            for step, data in enumerate(self.dataset):

--- a/python/paddle/distributed/auto_parallel/dist_op.py
+++ b/python/paddle/distributed/auto_parallel/dist_op.py
@@ -26,6 +26,7 @@ from .dist_attribute import get_op_dist_attr_field_keys
 class DistributedOperator:
    def __init__(self, serial_op, dist_attr=None):
        self._serial_op = serial_op
        self._serial_inputs = {}
@@ -248,6 +249,7 @@ class DistributedOperator:
 class DistributedModule:
    def __init__(self, serial_module, dist_attr=None):
        self._serial_module = serial_module
        self._dist_attr = dist_attr

--- a/python/paddle/distributed/auto_parallel/dist_saver.py
+++ b/python/paddle/distributed/auto_parallel/dist_saver.py
@@ -53,6 +53,7 @@ def _process_path(path):
 class DistributedSaver:
    def __init__(self):
        self._logger = get_logger(logging.INFO)
@@ -114,8 +115,8 @@ class DistributedSaver:
                              param_file):
                param_file_list.append(os.path.join(dirname, param_file))
        param_file_list.sort()
-        self._logger.info("Load distributed attribute file: {}".format(
+        self._logger.info(
-            param_file_list))
+            "Load distributed attribute file: {}".format(param_file_list))
        param_dict = {}
        for param_file in param_file_list:
            with open(param_file, 'rb') as f:
@@ -131,11 +132,11 @@ class DistributedSaver:
        for dist_attr_file in os.listdir(dirname):
            if check_filename('{}(.*)_dist(.*).pdattr'.format(filename),
                              dist_attr_file):
-                dist_attr_file_list.append(
+                dist_attr_file_list.append(os.path.join(dirname,
-                    os.path.join(dirname, dist_attr_file))
+                                                        dist_attr_file))
        dist_attr_file_list.sort()
-        self._logger.info("Load distributed attribute file: {}".format(
+        self._logger.info(
-            dist_attr_file_list))
+            "Load distributed attribute file: {}".format(dist_attr_file_list))
        pre_dist_attr = {}
        for dist_attr_file in dist_attr_file_list:
            with open(dist_attr_file, 'rb') as f:
@@ -206,12 +207,11 @@ class DistributedSaver:
        # NOTE: `paddle.static.save_inference_model` does not support subblock.
        dist_filename = filename + "_dist" + str(rank_id)
        dist_path = os.path.join(dirname, dist_filename)
-        paddle.static.save_inference_model(
+        paddle.static.save_inference_model(dist_path,
-            dist_path,
+                                           dist_feed_vars,
-            dist_feed_vars,
+                                           dist_fetch_vars,
-            dist_fetch_vars,
+                                           exe,
-            exe,
+                                           program=dist_main_prog)
-            program=dist_main_prog)
    def _save_rank_mapping(self, dirname):
        path = os.path.join(dirname, 'rank_mapping.csv')

--- a/python/paddle/distributed/auto_parallel/dist_tensor.py
+++ b/python/paddle/distributed/auto_parallel/dist_tensor.py
@@ -40,26 +40,26 @@ class DistributedTensor:
                                      processes,
                                      rank=None,
                                      shard_sizes=None):
-        if not (isinstance(sizes, (list, tuple)) and
+        if not (isinstance(sizes, (list, tuple))
-                all(map(lambda x: isinstance(x, int) and x >= 0, sizes))):
+                and all(map(lambda x: isinstance(x, int) and x >= 0, sizes))):
            raise ValueError(
-                "The sizes must be list or tuple and item in sizes must be non-negative integer, but got {}".
+                "The sizes must be list or tuple and item in sizes must be non-negative integer, but got {}"
-                format(sizes))
+                .format(sizes))
        if not (isinstance(dims_mapping, (list, tuple)) and all(
                map(lambda x: isinstance(x, int) and x >= -1, dims_mapping))):
            raise ValueError(
-                "The dims_mapping must be list or tuple and item in dims_mapping must >= -1, but got {}".
+                "The dims_mapping must be list or tuple and item in dims_mapping must >= -1, but got {}"
-                format(dims_mapping))
+                .format(dims_mapping))
-        if not (isinstance(processes, (list, tuple)) and
+        if not (isinstance(processes, (list, tuple)) and all(
-                all(map(lambda x: isinstance(x, int) and x >= 0, processes))):
+                map(lambda x: isinstance(x, int) and x >= 0, processes))):
            raise ValueError(
-                "The processes must be list or tuple and item in processes must be integer, but got {}".
+                "The processes must be list or tuple and item in processes must be integer, but got {}"
-                format(processes))
+                .format(processes))
-        if not (isinstance(topology, (list, tuple)) and
+        if not (isinstance(topology, (list, tuple))
-                all(map(lambda x: isinstance(x, int) and x > 0, topology))):
+                and all(map(lambda x: isinstance(x, int) and x > 0, topology))):
            raise ValueError(
-                "The topology must be list or tuple and item in topology must be non-negative integer, but got {}".
+                "The topology must be list or tuple and item in topology must be non-negative integer, but got {}"
-                format(topology))
+                .format(topology))
        if rank is not None and not (isinstance(rank, int) and rank >= 0):
            raise ValueError("The rank must >= 0, but got {}".format(rank))
@@ -74,8 +74,10 @@ class DistributedTensor:
                        processes,
                        rank=None,
                        shard_sizes=None):
-        DistributedTensor._validate_sizes_and_dist_attr(
+        DistributedTensor._validate_sizes_and_dist_attr(global_sizes,
-            global_sizes, dims_mapping, topology, processes, rank, shard_sizes)
+                                                        dims_mapping, topology,
+                                                        processes, rank,
+                                                        shard_sizes)
        local_sizes = []
        # for even sharding, the local sizes of every rank are equal
@@ -97,8 +99,10 @@ class DistributedTensor:
                          processes,
                          rank,
                          shard_sizes=None):
-        local_sizes = DistributedTensor.get_local_sizes(
+        local_sizes = DistributedTensor.get_local_sizes(global_sizes,
-            global_sizes, dims_mapping, topology, processes, rank, shard_sizes)
+                                                        dims_mapping, topology,
+                                                        processes, rank,
+                                                        shard_sizes)
        local_offsets = []
        rank_relatvie = processes.index(rank)
        coordinate = _linear_idx2coordinate(topology, rank_relatvie)
@@ -118,8 +122,10 @@ class DistributedTensor:
                         processes,
                         rank=None,
                         shard_sizes=None):
-        DistributedTensor._validate_sizes_and_dist_attr(
+        DistributedTensor._validate_sizes_and_dist_attr(local_sizes,
-            local_sizes, dims_mapping, topology, processes, rank, shard_sizes)
+                                                        dims_mapping, topology,
+                                                        processes, rank,
+                                                        shard_sizes)
        global_sizes = []
        for idx, item in enumerate(local_sizes):
            if dims_mapping[idx] == -1:
@@ -137,8 +143,10 @@ class DistributedTensor:
                        shard_sizes=None):
        local_offsets = DistributedTensor.get_local_offsets(
            global_sizes, dims_mapping, topology, processes, rank, shard_sizes)
-        local_sizes = DistributedTensor.get_local_sizes(
+        local_sizes = DistributedTensor.get_local_sizes(global_sizes,
-            global_sizes, dims_mapping, topology, processes, rank, shard_sizes)
+                                                        dims_mapping, topology,
+                                                        processes, rank,
+                                                        shard_sizes)
        assert len(local_sizes) == len(
            local_offsets
        ), "The length of local_sizes must be equal to local_offsets, but got {} and {}.".format(

--- a/python/paddle/distributed/auto_parallel/engine.py
+++ b/python/paddle/distributed/auto_parallel/engine.py
@@ -48,6 +48,7 @@ from .dist_context import DistributedContext, get_default_distributed_context
 class Engine:
    def __init__(self,
                 model=None,
                 inputs_spec=None,
@@ -88,8 +89,9 @@ class Engine:
                gradient_scale=True,
                metrics=None,
                all_ranks=False):
-        if optimizer and not isinstance(optimizer, (
+        if optimizer and not isinstance(
-                paddle.optimizer.Optimizer, paddle.fluid.optimizer.Optimizer)):
+                optimizer,
+            (paddle.optimizer.Optimizer, paddle.fluid.optimizer.Optimizer)):
            raise TypeError(
                    "'optimizer' must be object of class `paddle.optimizer.Optimizer`" \
                        " or `paddle.fluid.optimizer.Optimizer`."
@@ -194,7 +196,7 @@ class Engine:
            parallelizer.parallel_all()
    def _init_dist_context(self, mode):
-        # Init dist_context['mode'] with the first planned dist_context 
+        # Init dist_context['mode'] with the first planned dist_context
        # to guarantee that train/eval/predict mode have same parallel strategy
        dist_context = self._dist_contexts[mode]
        origin_main_prog = dist_context._original_serial_main_program
@@ -212,7 +214,7 @@ class Engine:
                dist_context.set_op_dist_attr_for_program(op, ref_op_dist_attr)
    def _initialize(self, mode):
-        # Get the current content from the distributed context 
+        # Get the current content from the distributed context
        self._serial_main_progs[mode] = self._dist_contexts[
            mode].serial_main_program
        self._serial_startup_progs[mode] = self._dist_contexts[
@@ -380,7 +382,7 @@ class Engine:
        dist_context = self._dist_contexts[self.mode]
        dist_main_block = dist_main_prog.global_block()
-        # NOTE: Get feed_list from dist_program, then insert dataloader op 
+        # NOTE: Get feed_list from dist_program, then insert dataloader op
        # with sharded var shape. Because predict_program does not contain
        # labels var, so we will filter dataset's value with length of feed_list.
        inputs_var = self._feed_vars[self.mode]["inputs"]
@@ -389,8 +391,8 @@ class Engine:
        for var in inputs_var + labels_var:
            if var.name in dist_main_block.vars:
                feed_list.append(dist_main_block.vars[var.name])
-        dp_world_size, dp_rank = self._get_data_parallel_info(feed_list[0],
+        dp_world_size, dp_rank = self._get_data_parallel_info(
-                                                              dist_context)
+            feed_list[0], dist_context)
        # remove the first three ops if multi run fit/evaluate/predict
        op_size = len(dist_main_block.ops)
@@ -418,8 +420,9 @@ class Engine:
            op = dist_main_block.ops[new_op_size - 1]
            new_op_desc = dist_main_block.desc._prepend_op()
            new_op_desc.copy_from(op.desc)
-            new_op = Operator(
+            new_op = Operator(dist_main_block,
-                dist_main_block, new_op_desc, type=new_op_desc.type())
+                              new_op_desc,
+                              type=new_op_desc.type())
            dist_main_block.ops.insert(0, new_op)
            dist_op = DistributedOperator(new_op)
            dist_context.add_dist_op_for_program(dist_op)
@@ -442,21 +445,21 @@ class Engine:
    def _set_data_parallel(self, var):
        if self._nranks == 1:
            self._default_strategy = 'serial'
-            auto.shard_tensor(
+            auto.shard_tensor(var,
-                var,
+                              dist_attr={
-                dist_attr={
+                                  "process_mesh": [0],
-                    "process_mesh": [0],
+                                  "dims_mapping":
-                    "dims_mapping": [-1 for _ in range(len(var.shape))]
+                                  [-1 for _ in range(len(var.shape))]
-                })
+                              })
        else:
            self._default_strategy = 'dp'
-            auto.shard_tensor(
+            auto.shard_tensor(var,
-                var,
+                              dist_attr={
-                dist_attr={
+                                  "process_mesh":
-                    "process_mesh": list(range(self._nranks)),
+                                  list(range(self._nranks)),
-                    "dims_mapping":
+                                  "dims_mapping":
-                    [0] + [-1 for _ in range(len(var.shape) - 1)]
+                                  [0] + [-1 for _ in range(len(var.shape) - 1)]
-                })
+                              })
        return var
@@ -492,22 +495,20 @@ class Engine:
            serial_program = self._serial_main_progs["train"]
            dist_main_prog = self._dist_main_progs["train"][self._cur_rank]
            dist_context = self._dist_contexts["train"]
-            self._saver.save(
+            self._saver.save(path,
-                path,
+                             serial_program=serial_program,
-                serial_program=serial_program,
+                             dist_main_program=dist_main_prog,
-                dist_main_program=dist_main_prog,
+                             dist_context=dist_context)
-                dist_context=dist_context)
        else:
            assert mode, "Please set the 'mode' you want to save."
            feed_vars = self._feed_vars[mode]['inputs']
            fetch_vars = self._fetch_vars[mode]['outputs']
            dist_main_prog = self._dist_main_progs[mode][self._cur_rank]
-            self._saver.save_inference_model(
+            self._saver.save_inference_model(path,
-                path,
+                                             feed_vars,
-                feed_vars,
+                                             fetch_vars,
-                fetch_vars,
+                                             self._executor,
-                self._executor,
+                                             program=dist_main_prog)
-                program=dist_main_prog)
    def load(self, path, strict=True, load_optimizer=True, mode=None):
        if not mode:

--- a/python/paddle/distributed/auto_parallel/graph.py
+++ b/python/paddle/distributed/auto_parallel/graph.py
@@ -14,6 +14,7 @@
 class Node:
    def __init__(self, id, **attrs):
        # Each node must has a unique id
        self._id = id
@@ -47,6 +48,7 @@ class Node:
 class Edge:
    def __init__(self, src_id, tgt_id, **attrs):
        # The id of source node in an Edge
        self._src_id = src_id
@@ -88,6 +90,7 @@ class Edge:
 class Graph:
    def __init__(self, **attrs):
        # _nodes is dict for storing the nodes of the graph.
        # The key of this dict is the node id.

--- a/python/paddle/distributed/auto_parallel/mapper.py
+++ b/python/paddle/distributed/auto_parallel/mapper.py
@@ -171,8 +171,9 @@ def build_process_graph(distributed_program):
            src_info, src_rank)
        graph.add_node(src_rank, resource_requirements=resource_requirements)
        for tgt_rank, comm_requirements in comm_requirements_to_ranks.items():
-            graph.add_edge(
+            graph.add_edge(src_rank,
-                src_rank, tgt_rank, comm_requirements=comm_requirements)
+                           tgt_rank,
+                           comm_requirements=comm_requirements)
    return graph
@@ -192,8 +193,9 @@ def build_cluster_graph(cluster):
            else:
                graph.nodes[device.global_id]["occupied"] = False
        for link in machine.links.values():
-            graph.add_edge(
+            graph.add_edge(link.source.global_id,
-                link.source.global_id, link.target.global_id, link=link)
+                           link.target.global_id,
+                           link=link)
    return graph
@@ -233,8 +235,8 @@ def mapping(distributed_program, cluster):
            device_type = cur_rank_node["resource_requirements"]["device_type"]
            cur_device_node = None
            for device_node in cluster_graph.nodes.values():
-                if (device_node["device"].type == device_type) and (
+                if (device_node["device"].type
-                        not device_node["occupied"]):
+                        == device_type) and (not device_node["occupied"]):
                    device_node["occupied"] = True
                    cur_rank_node["visited"] = True
                    cur_rank_node["device"] = device_node["device"]
@@ -257,8 +259,8 @@ def mapping(distributed_program, cluster):
            nbr_device_edges.sort(key=sort_by_comm_bandwidth)
            for nbr_rank_edge in nbr_rank_edges:
-                src_rank_node = process_graph.nodes[nbr_rank_edge.src_id][
+                src_rank_node = process_graph.nodes[
-                    "visited"]
+                    nbr_rank_edge.src_id]["visited"]
                if src_rank_node:
                    continue
                device_type = src_rank_node["resource_requirements"][

--- a/python/paddle/distributed/auto_parallel/operators/common.py
+++ b/python/paddle/distributed/auto_parallel/operators/common.py
@@ -32,6 +32,7 @@ def is_elementwise_op(op_type):
 class DistributedOperatorImplContainer:
    def __init__(self, op_type):
        self._type = op_type
        self._impls = []
@@ -81,6 +82,7 @@ class DistributedOperatorImplContainer:
 class DistributedOperatorImpl(abc.ABC):
    def __init__(self, name):
        self._name = name
        self._type = None

--- a/python/paddle/distributed/auto_parallel/operators/dist_check_finite_and_unscale.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_check_finite_and_unscale.py
@@ -30,6 +30,7 @@ world_process_group = get_world_process_group()
 class DistributedCheckFiniteAndUnscale(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedCheckFiniteAndUnscale, self).__init__(op_type)
@@ -39,6 +40,7 @@ register_distributed_operator_impl_container(
 class DistributedCheckFiniteAndUnscaleImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedCheckFiniteAndUnscaleImpl, self).__init__(name)
        self._name = name
@@ -122,41 +124,37 @@ class DistributedCheckFiniteAndUnscaleImpl(DistributedOperatorImpl):
        group = new_process_group(world_process_group.ranks)
        inf_var = main_block.var(kwargs['FoundInfinite'][0])
-        inf_var_int32 = main_block.create_var(
+        inf_var_int32 = main_block.create_var(name=inf_var.name + "@cast_int32",
-            name=inf_var.name + "@cast_int32",
+                                              shape=inf_var.shape,
-            shape=inf_var.shape,
+                                              dtype=core.VarDesc.VarType.INT32)
-            dtype=core.VarDesc.VarType.INT32)
        set_var_dist_attr(
            ctx, inf_var_int32,
            ctx.get_tensor_dist_attr_for_program(inf_var).dims_mapping,
            ctx.get_tensor_dist_attr_for_program(inf_var).process_mesh)
-        cast_op1 = main_block.append_op(
+        cast_op1 = main_block.append_op(type='cast',
-            type='cast',
+                                        inputs={'X': inf_var},
-            inputs={'X': inf_var},
+                                        outputs={'Out': inf_var_int32},
-            outputs={'Out': inf_var_int32},
+                                        attrs={
-            attrs={
+                                            "in_dtype": inf_var.dtype,
-                "in_dtype": inf_var.dtype,
+                                            "out_dtype": inf_var_int32.dtype,
-                "out_dtype": inf_var_int32.dtype,
+                                            OP_ROLE_KEY: OpRole.Backward
-                OP_ROLE_KEY: OpRole.Backward
+                                        })
-            })
+        allreduce_op = main_block.append_op(type='c_allreduce_max',
-        allreduce_op = main_block.append_op(
+                                            inputs={'X': inf_var_int32},
-            type='c_allreduce_max',
+                                            outputs={'Out': inf_var_int32},
-            inputs={'X': inf_var_int32},
+                                            attrs={
-            outputs={'Out': inf_var_int32},
+                                                'ring_id': group.id,
-            attrs={
+                                                'use_calc_stream': True,
-                'ring_id': group.id,
+                                                OP_ROLE_KEY: OpRole.Backward
-                'use_calc_stream': True,
+                                            })
-                OP_ROLE_KEY: OpRole.Backward
+        cast_op2 = main_block.append_op(type='cast',
-            })
+                                        inputs={'X': inf_var_int32},
-        cast_op2 = main_block.append_op(
+                                        outputs={'Out': inf_var},
-            type='cast',
+                                        attrs={
-            inputs={'X': inf_var_int32},
+                                            "in_dtype": inf_var_int32.dtype,
-            outputs={'Out': inf_var},
+                                            "out_dtype": inf_var.dtype,
-            attrs={
+                                            OP_ROLE_KEY: OpRole.Backward
-                "in_dtype": inf_var_int32.dtype,
+                                        })
-                "out_dtype": inf_var.dtype,
-                OP_ROLE_KEY: OpRole.Backward
-            })
        main_block._sync_with_cpp()
        for op in [cast_op1, allreduce_op, cast_op2]:

--- a/python/paddle/distributed/auto_parallel/operators/dist_default.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_default.py
@@ -47,28 +47,26 @@ def prim_operator_data_parallel_functor(ctx, src_op):
        ctx.synced_gradient.add(var_name)
        sync_group = new_process_group(ctx.data_parallel_group)
-        allreduce_op = main_block.append_op(
+        allreduce_op = main_block.append_op(type='c_allreduce_sum',
-            type='c_allreduce_sum',
+                                            inputs={'X': [var_name]},
-            inputs={'X': [var_name]},
+                                            outputs={'Out': [var_name]},
-            outputs={'Out': [var_name]},
+                                            attrs={
-            attrs={
+                                                'ring_id': sync_group.id,
-                'ring_id': sync_group.id,
+                                                'use_calc_stream': True,
-                'use_calc_stream': True,
+                                                OP_ROLE_KEY: OpRole.Backward
-                OP_ROLE_KEY: OpRole.Backward
+                                            })
-            })
        param = ctx.grads_params[var_name]
        startup_block = dist_op_context.startup_block
-        new_op = startup_block.append_op(
+        new_op = startup_block.append_op(type='c_broadcast',
-            type='c_broadcast',
+                                         inputs={'X': [param]},
-            inputs={'X': [param]},
+                                         outputs={'Out': [param]},
-            outputs={'Out': [param]},
+                                         attrs={
-            attrs={
+                                             'ring_id': sync_group.id,
-                'ring_id': sync_group.id,
+                                             'root': 0,
-                'root': 0,
+                                             'use_calc_stream': True,
-                'use_calc_stream': True,
+                                             OP_ROLE_KEY: OpRole.Forward
-                OP_ROLE_KEY: OpRole.Forward
+                                         })
-            })
        grad_var = main_block.var(var_name)
        dims_mapping = ctx.get_tensor_dist_attr_for_program(
@@ -85,6 +83,7 @@ def prim_operator_data_parallel_functor(ctx, src_op):
 class DistributedDefault(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedDefault, self).__init__(op_type)
@@ -94,6 +93,7 @@ register_distributed_operator_impl_container(DistributedDefault("default"))
 # Replicated Default
 class DistributedDefaultImpl0(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedDefaultImpl0, self).__init__(name)
        self._forward_implemented = True
@@ -277,8 +277,8 @@ class DistributedDefaultImpl0(DistributedOperatorImpl):
                batch_dim_mappings.append(dims_mapping[1])
        for arg_name in op_desc.output_arg_names():
            if op_desc.type() == "fill_zeros_like":
-                input_tensor = dist_op.get_serial_input(op_desc.input_arg_names(
+                input_tensor = dist_op.get_serial_input(
-                )[0])
+                    op_desc.input_arg_names()[0])
                if input_tensor.is_parameter:
                    continue
            serial_tensor = dist_op.get_serial_output(arg_name)
@@ -316,8 +316,8 @@ class DistributedDefaultImpl0(DistributedOperatorImpl):
                    changed = True
        for arg_name in op_desc.output_arg_names():
            if op_desc.type() == "fill_zeros_like":
-                input_tensor = dist_op.get_serial_input(op_desc.input_arg_names(
+                input_tensor = dist_op.get_serial_input(
-                )[0])
+                    op_desc.input_arg_names()[0])
                if input_tensor.is_parameter:
                    continue
            if op_desc.type() in ["shape", "slice"]:
@@ -409,16 +409,19 @@ class DistributedDefaultImpl0(DistributedOperatorImpl):
                                                      axis, rank_id)
                        sync_group = new_process_group(group_ranks)
-                        new_op = startup_block.append_op(
+                        new_op = startup_block.append_op(type='c_broadcast',
-                            type='c_broadcast',
+                                                         inputs={'X': param},
-                            inputs={'X': param},
+                                                         outputs={'Out': param},
-                            outputs={'Out': param},
+                                                         attrs={
-                            attrs={
+                                                             'ring_id':
-                                'ring_id': sync_group.id,
+                                                             sync_group.id,
-                                'root': 0,
+                                                             'root':
-                                'use_calc_stream': True,
+                                                             0,
-                                OP_ROLE_KEY: OpRole.Forward
+                                                             'use_calc_stream':
-                            })
+                                                             True,
+                                                             OP_ROLE_KEY:
+                                                             OpRole.Forward
+                                                         })
                        # set distributed attribute
                        op_attr = OperatorDistributedAttribute()
@@ -484,8 +487,8 @@ class DistributedDefaultImpl0(DistributedOperatorImpl):
                    # FIXME (JZ-LIANG) Remove this hack to support any op mesh group for Pipeline Parallelism
                    if rank_id not in process_mesh.processes:
-                        rank_id = _get_corresponding_rank(ctx, process_mesh,
+                        rank_id = _get_corresponding_rank(
-                                                          rank_id)
+                            ctx, process_mesh, rank_id)
                    mesh_shape = process_mesh.topology
                    batch_size_axis = var_dim_mapping[0]

--- a/python/paddle/distributed/auto_parallel/operators/dist_eltwise.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_eltwise.py
@@ -35,6 +35,7 @@ from .dist_default import DistributedDefaultImpl0
 class DistributedElementwise(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedElementwise, self).__init__(op_type)
@@ -45,6 +46,7 @@ register_distributed_operator_impl_container(
 # Replicated Elementwise
 class DistributedElementwiseImpl0(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedElementwiseImpl0, self).__init__(name)
        self._forward_implemented = False
@@ -208,8 +210,8 @@ class DistributedElementwiseImpl0(DistributedOperatorImpl):
                    changed = True
            else:
                if compatible_dims_mapping != input_dims_mapping_dict[arg_name]:
-                    op_dist_attr.set_input_dims_mapping(arg_name,
+                    op_dist_attr.set_input_dims_mapping(
-                                                        compatible_dims_mapping)
+                        arg_name, compatible_dims_mapping)
                    changed = True
        for arg_name in output_arg_names:
@@ -222,12 +224,11 @@ class DistributedElementwiseImpl0(DistributedOperatorImpl):
                               output_dims_mapping_lens[arg_name]) + i
                    new_dims_mapping[i] = compatible_dims_mapping[new_idx]
                if new_dims_mapping != output_dims_mapping_dict[arg_name]:
-                    op_dist_attr.set_output_dims_mapping(arg_name,
+                    op_dist_attr.set_output_dims_mapping(
-                                                         new_dims_mapping)
+                        arg_name, new_dims_mapping)
                    changed = True
            else:
-                if compatible_dims_mapping != output_dims_mapping_dict[
+                if compatible_dims_mapping != output_dims_mapping_dict[arg_name]:
-                        arg_name]:
                    op_dist_attr.set_output_dims_mapping(
                        arg_name, compatible_dims_mapping)
                    changed = True

--- a/python/paddle/distributed/auto_parallel/operators/dist_embedding.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_embedding.py
@@ -34,6 +34,7 @@ from ..utils import _get_comm_group, _get_idx_in_axis, _get_corresponding_rank
 class DistributedEmbedding(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedEmbedding, self).__init__(op_type)
@@ -46,6 +47,7 @@ register_distributed_operator_impl_container(
 # RowParallel
 class DistributedEmbeddingImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedEmbeddingImpl, self).__init__(name)
        self._forward_implemented = True
@@ -58,8 +60,8 @@ class DistributedEmbeddingImpl(DistributedOperatorImpl):
        w_name = op_desc.input('W')[0]
        ids_dims_mapping = op_dist_attr.get_input_dims_mapping(ids_name)
        w_dims_mapping = op_dist_attr.get_input_dims_mapping(w_name)
-        if is_dim_replicate(w_dims_mapping[-2]) or is_dim_shard(w_dims_mapping[
+        if is_dim_replicate(w_dims_mapping[-2]) or is_dim_shard(
-                -1]):
+                w_dims_mapping[-1]):
            return False
        # Other dimensions must be replicate except the batch dimension
        for mapping in ids_dims_mapping[1:]:
@@ -215,8 +217,10 @@ class DistributedEmbeddingImpl(DistributedOperatorImpl):
        c_embedding_op = main_block.append_op(
            type='c_embedding',
-            inputs={'Ids': [Ids_var],
+            inputs={
-                    'W': [Weight_var]},
+                'Ids': [Ids_var],
+                'W': [Weight_var]
+            },
            outputs={'Out': [intermediate_var_0]},
            attrs={"start_index": relative_idx})
        if intermediate_var_0.shape != ref_shape:
@@ -295,16 +299,15 @@ class DistributedEmbeddingImpl(DistributedOperatorImpl):
                                                  rank_id)
                    sync_group = new_process_group(group_ranks)
-                    startup_block.append_op(
+                    startup_block.append_op(type='c_broadcast',
-                        type='c_broadcast',
+                                            inputs={'X': param},
-                        inputs={'X': param},
+                                            outputs={'Out': param},
-                        outputs={'Out': param},
+                                            attrs={
-                        attrs={
+                                                'ring_id': sync_group.id,
-                            'ring_id': sync_group.id,
+                                                'root': 0,
-                            'root': 0,
+                                                'use_calc_stream': True,
-                            'use_calc_stream': True,
+                                                OP_ROLE_KEY: OpRole.Forward
-                            OP_ROLE_KEY: OpRole.Forward
+                                            })
-                        })
            startup_block._sync_with_cpp()
    @staticmethod
@@ -440,21 +443,21 @@ class DistributedEmbeddingImpl(DistributedOperatorImpl):
        if need_gradient_allreduce:
            W_Grad_var = main_block.var(kwargs['W@GRAD'][0])
-            allreduce_op = main_block.append_op(
+            allreduce_op = main_block.append_op(type='c_allreduce_sum',
-                type='c_allreduce_sum',
+                                                inputs={'X': [W_Grad_var]},
-                inputs={'X': [W_Grad_var]},
+                                                outputs={'Out': [W_Grad_var]},
-                outputs={'Out': [W_Grad_var]},
+                                                attrs={
-                attrs={
+                                                    'ring_id': dp_group.id,
-                    'ring_id': dp_group.id,
+                                                    'use_calc_stream': True,
-                    'use_calc_stream': True,
+                                                    OP_ROLE_KEY: OpRole.Backward
-                    OP_ROLE_KEY: OpRole.Backward
+                                                })
-                })
+            scale_op = main_block.append_op(type='scale',
-            scale_op = main_block.append_op(
+                                            inputs={'X': W_Grad_var},
-                type='scale',
+                                            outputs={'Out': W_Grad_var},
-                inputs={'X': W_Grad_var},
+                                            attrs={
-                outputs={'Out': W_Grad_var},
+                                                'scale': 1.0 / dp_degree,
-                attrs={'scale': 1.0 / dp_degree,
+                                                OP_ROLE_KEY: OpRole.Backward
-                       OP_ROLE_KEY: OpRole.Backward})
+                                            })
            main_block._sync_with_cpp()
            dims_mapping = ctx.get_tensor_dist_attr_for_program(

--- a/python/paddle/distributed/auto_parallel/operators/dist_fill_constant_batch_size_like.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_fill_constant_batch_size_like.py
@@ -31,6 +31,7 @@ from .dist_default import DistributedDefaultImpl0
 class DistributedFillConstantBatchSizeLike(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedFillConstantBatchSizeLike, self).__init__(op_type)
@@ -40,6 +41,7 @@ register_distributed_operator_impl_container(
 class DistributedFillConstantBatchSizeLikeImpl0(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedFillConstantBatchSizeLikeImpl0, self).__init__(name)
        self._forward_implemented = True

--- a/python/paddle/distributed/auto_parallel/operators/dist_fused_attention.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_fused_attention.py
 # Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -27,6 +27,7 @@ from ..process_group import new_process_group
 class DistributedFusedAttention(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedFusedAttention, self).__init__(op_type)
@@ -36,6 +37,7 @@ register_distributed_operator_impl_container(
 class DistributedFusedAttentionImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedFusedAttentionImpl, self).__init__(name)
        self._forward_implemented = True
@@ -60,8 +62,8 @@ class DistributedFusedAttentionImpl(DistributedOperatorImpl):
        for mapping in x_dims_mapping[1:-1]:
            if is_dim_shard(mapping):
                return False
-        if len(qkv_w_dims_mapping) != 4 or is_dim_replicate(qkv_w_dims_mapping[
+        if len(qkv_w_dims_mapping) != 4 or is_dim_replicate(
-                head_axis]):
+                qkv_w_dims_mapping[head_axis]):
            return False
        if len(qkv_bias_dims_mapping) != 3 or is_dim_replicate(
                qkv_bias_dims_mapping[head_axis]):
@@ -91,7 +93,7 @@ class DistributedFusedAttentionImpl(DistributedOperatorImpl):
        op_desc = dist_op.serial_op.desc
        op_dist_attr = dist_op.dist_attr
-        # none of output should be sharded 
+        # none of output should be sharded
        for out_name in op_desc.output_names():
            out = op_desc.output(out_name)[0]
            out_dims_mapping = op_dist_attr.get_output_dims_mapping(out)
@@ -152,8 +154,8 @@ class DistributedFusedAttentionImpl(DistributedOperatorImpl):
        # infer logic comm presentation
        head_axis = 1
        qkv_w = src_op.input('QKVW')[0]
-        qkv_w_col_dim_mapping = op_dist_attr.get_input_dims_mapping(qkv_w)[
+        qkv_w_col_dim_mapping = op_dist_attr.get_input_dims_mapping(
-            head_axis]
+            qkv_w)[head_axis]
        assert qkv_w_col_dim_mapping >= 0, "col_parallel_matmul's row should be divided by a specific mesh axis, but got [{}]".format(
            qkv_w_col_dim_mapping)
        process_mesh_shape = op_dist_attr.process_mesh.topology

--- a/python/paddle/distributed/auto_parallel/operators/dist_fused_feedforward.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_fused_feedforward.py
 # Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -27,6 +27,7 @@ from ..process_group import new_process_group
 class DistributedFusedFeedForward(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedFusedFeedForward, self).__init__(op_type)
@@ -36,6 +37,7 @@ register_distributed_operator_impl_container(
 class DistributedFusedFeedForwardImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedFusedFeedForwardImpl, self).__init__(name)
        self._forward_implemented = True
@@ -82,7 +84,7 @@ class DistributedFusedFeedForwardImpl(DistributedOperatorImpl):
        op_desc = dist_op.serial_op.desc
        op_dist_attr = dist_op.dist_attr
-        # none of output should be sharded 
+        # none of output should be sharded
        for out_name in op_desc.output_names():
            out = op_desc.output(out_name)[0]
            out_dims_mapping = op_dist_attr.get_output_dims_mapping(out)

--- a/python/paddle/distributed/auto_parallel/operators/dist_matmul.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_matmul.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_pnorm.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_pnorm.py
 # Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -34,6 +34,7 @@ from paddle.fluid.data_feeder import check_variable_and_dtype, check_dtype
 class DistributedPNorm(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedPNorm, self).__init__(op_type)
@@ -52,19 +53,21 @@ def _insert_fill_constant_op(block, op_role):
    attrs['value'] = int("1")
    attrs['dtype'] = out.dtype
    attrs['op_role'] = op_role
-    utils.get_shape_tensor_inputs(
+    utils.get_shape_tensor_inputs(inputs=inputs,
-        inputs=inputs, attrs=attrs, shape=[0], op_type='fill_constant')
+                                  attrs=attrs,
-    fill_constant_op = block.append_op(
+                                  shape=[0],
-        type='fill_constant',
+                                  op_type='fill_constant')
-        inputs=inputs,
+    fill_constant_op = block.append_op(type='fill_constant',
-        outputs={'Out': [out]},
+                                       inputs=inputs,
-        attrs=attrs)
+                                       outputs={'Out': [out]},
+                                       attrs=attrs)
    out.stop_gradient = True
    return out, fill_constant_op
 # Row Parallel
 class DistributedPNormImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedPNormImpl, self).__init__(name)
        self._forward_implemented = True
@@ -193,15 +196,14 @@ class DistributedPNormImpl(DistributedOperatorImpl):
        # set fill_constant op dist_attr
        constant_op_dist_attr = OperatorDistributedAttribute()
        constant_op_dist_attr.process_mesh = ref_process_mesh
-        constant_op_dist_attr.set_output_dims_mapping(fill_constant_out.name,
+        constant_op_dist_attr.set_output_dims_mapping(
-                                                      constant_out_dims_mapping)
+            fill_constant_out.name, constant_out_dims_mapping)
        ctx.set_op_dist_attr_for_program(fill_constant_op,
                                         constant_op_dist_attr)
-        barrier_op = main_block.append_op(
+        barrier_op = main_block.append_op(type='barrier',
-            type='barrier',
+                                          inputs={'X': [fill_constant_out]},
-            inputs={'X': [fill_constant_out]},
+                                          outputs={'Out': [fill_constant_out]},
-            outputs={'Out': [fill_constant_out]},
+                                          attrs={'ring_id': group.id})
-            attrs={'ring_id': group.id})
        # set barrier op dist attr
        set_comm_op_dist_attr_for_program(barrier_op, ref_process_mesh,
                                          constant_out_dist_attr, ctx)
@@ -223,16 +225,16 @@ class DistributedPNormImpl(DistributedOperatorImpl):
        ]
        ctx.set_tensor_dist_attr_for_program(allgather_out,
                                             allgather_out_dist_attr)
-        c_allgather_op = main_block.append_op(
+        c_allgather_op = main_block.append_op(type='c_allgather',
-            type='c_allgather',
+                                              inputs={'X': [X_var]},
-            inputs={'X': [X_var]},
+                                              outputs={'Out': [allgather_out]},
-            outputs={'Out': [allgather_out]},
+                                              attrs={
-            attrs={
+                                                  'ring_id': group.id,
-                'ring_id': group.id,
+                                                  'use_calc_stream': True,
-                'use_calc_stream': True,
+                                                  'nranks': group.nranks,
-                'nranks': group.nranks,
+                                                  'op_role':
-                'op_role': src_op.attr('op_role')
+                                                  src_op.attr('op_role')
-            })
+                                              })
        # set c_allgather op dist_attr
        allgather_op_dist_attr = OperatorDistributedAttribute()
        allgather_op_dist_attr.process_mesh = op_dist_attr.process_mesh
@@ -344,11 +346,10 @@ class DistributedPNormImpl(DistributedOperatorImpl):
            "infer_flags": infer_flags,
            "op_role": backward_op.attr('op_role')
        }
-        slice_op = main_block.append_op(
+        slice_op = main_block.append_op(type='slice',
-            type='slice',
+                                        inputs={'Input': [new_X_grad]},
-            inputs={'Input': [new_X_grad]},
+                                        outputs={'Out': [X_grad_var]},
-            outputs={'Out': [X_grad_var]},
+                                        attrs=attrs)
-            attrs=attrs)
        X_grad_var_dims_mapping = op_dist_attr.get_output_dims_mapping(
            X_grad_var.name)
        slice_op_dist_attr = OperatorDistributedAttribute()

--- a/python/paddle/distributed/auto_parallel/operators/dist_reduce_p.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_reduce_p.py
@@ -34,6 +34,7 @@ from ..utils import _get_comm_group, _get_corresponding_rank
 class DistributedReducePrimtive(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedReducePrimtive, self).__init__(op_type)
@@ -44,6 +45,7 @@ register_distributed_operator_impl_container(
 # Batch Dimension Reduce Primitive
 class DistributedReducePrimtiveImpl0(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedReducePrimtiveImpl0, self).__init__(name)
        self._forward_implemented = True
@@ -119,15 +121,14 @@ class DistributedReducePrimtiveImpl0(DistributedOperatorImpl):
        # batch dimension synchronization
        var_name = src_op.output_arg_names[0]
        sync_group = new_process_group(ctx.data_parallel_group)
-        allreduce_op = main_block.append_op(
+        allreduce_op = main_block.append_op(type='c_allreduce_sum',
-            type='c_allreduce_sum',
+                                            inputs={'X': [var_name]},
-            inputs={'X': [var_name]},
+                                            outputs={'Out': [var_name]},
-            outputs={'Out': [var_name]},
+                                            attrs={
-            attrs={
+                                                'ring_id': sync_group.id,
-                'ring_id': sync_group.id,
+                                                'use_calc_stream': True,
-                'use_calc_stream': True,
+                                                OP_ROLE_KEY: OpRole.Forward
-                OP_ROLE_KEY: OpRole.Forward
+                                            })
-            })
        # dist attr
        var = main_block.var(var_name)

--- a/python/paddle/distributed/auto_parallel/operators/dist_reshape.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_reshape.py
@@ -31,6 +31,7 @@ from .dist_default import DistributedDefaultImpl0
 class DistributedReshape2(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedReshape2, self).__init__(op_type)
@@ -39,6 +40,7 @@ register_distributed_operator_impl_container(DistributedReshape2("reshape2"))
 class DistributedReshapeImpl0(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedReshapeImpl0, self).__init__(name)
        self._forward_implemented = True
@@ -171,8 +173,8 @@ class DistributedReshapeImpl0(DistributedOperatorImpl):
        for idx, axis in enumerate(dim_mapping):
            if axis >= 0:
                if len(shape_list) > idx:
-                    shape_list[idx] = shape_list[idx] // process_mesh_shape[
+                    shape_list[
-                        axis]
+                        idx] = shape_list[idx] // process_mesh_shape[axis]
        # create op
        new_op_desc = main_block.desc.append_op()
@@ -193,6 +195,7 @@ class DistributedReshapeImpl0(DistributedOperatorImpl):
 class DistributedReshapeImpl1(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedReshapeImpl1, self).__init__(name)
        self._forward_implemented = True
@@ -328,8 +331,8 @@ class DistributedReshapeImpl1(DistributedOperatorImpl):
        for idx, axis in enumerate(dim_mapping):
            if axis >= 0:
                if len(shape_list) > idx:
-                    shape_list[idx] = shape_list[idx] // process_mesh_shape[
+                    shape_list[
-                        axis]
+                        idx] = shape_list[idx] // process_mesh_shape[axis]
        # create op
        new_op_desc = main_block.desc.append_op()
@@ -350,6 +353,7 @@ class DistributedReshapeImpl1(DistributedOperatorImpl):
 class DistributedReshapeImpl2(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedReshapeImpl2, self).__init__(name)
        self._forward_implemented = True
@@ -478,8 +482,8 @@ class DistributedReshapeImpl2(DistributedOperatorImpl):
        for idx, axis in enumerate(out_dim_mapping):
            if axis >= 0:
                if len(shape_list) > idx:
-                    shape_list[idx] = shape_list[idx] // process_mesh_shape[
+                    shape_list[
-                        axis]
+                        idx] = shape_list[idx] // process_mesh_shape[axis]
        # create op
        new_op_desc = main_block.desc.append_op()

--- a/python/paddle/distributed/auto_parallel/operators/dist_slice.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_slice.py
@@ -23,6 +23,7 @@ from .dist_default import DistributedDefaultImpl0
 class DistributedSlice(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedSlice, self).__init__(op_type)
@@ -31,6 +32,7 @@ register_distributed_operator_impl_container(DistributedSlice("slice"))
 class DistributedSliceImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedSliceImpl, self).__init__(name)
        self._forward_implemented = True

--- a/python/paddle/distributed/auto_parallel/operators/dist_softmax.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_softmax.py
@@ -26,6 +26,7 @@ from .dist_default import DistributedDefaultImpl0
 class DistributedSoftmax(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedSoftmax, self).__init__(op_type)
@@ -34,6 +35,7 @@ register_distributed_operator_impl_container(DistributedSoftmax("softmax"))
 class DistributedSoftmaxImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedSoftmaxImpl, self).__init__(name)
        self._forward_implemented = False

--- a/python/paddle/distributed/auto_parallel/operators/dist_split.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_split.py
 # Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
-# 
+#
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-# 
+#
 #     http://www.apache.org/licenses/LICENSE-2.0
-# 
+#
 # Unless required by applicable law or agreed to in writing, software
 # distributed under the License is distributed on an "AS IS" BASIS,
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
@@ -25,6 +25,7 @@ from .dist_default import DistributedDefaultImpl0
 class DistributedSplit(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedSplit, self).__init__(op_type)
@@ -33,6 +34,7 @@ register_distributed_operator_impl_container(DistributedSplit("split"))
 class DistributedSplitImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedSplitImpl, self).__init__(name)
        self._forward_implemented = True

--- a/python/paddle/distributed/auto_parallel/operators/dist_transpose.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_transpose.py
@@ -26,6 +26,7 @@ from .dist_default import DistributedDefaultImpl0
 class DistributedTranspose2(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedTranspose2, self).__init__(op_type)
@@ -35,6 +36,7 @@ register_distributed_operator_impl_container(
 class DistributedTranspose2Impl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedTranspose2Impl, self).__init__(name)
        self._forward_implemented = False

--- a/python/paddle/distributed/auto_parallel/operators/dist_update_loss_scaling.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_update_loss_scaling.py
@@ -20,6 +20,7 @@ from ..utils import set_dist_op_desc_original_id
 class DistributedUpdateLossScaling(DistributedOperatorImplContainer):
    def __init__(self, op_type):
        super(DistributedUpdateLossScaling, self).__init__(op_type)
@@ -29,6 +30,7 @@ register_distributed_operator_impl_container(
 class DistributedUpdateLossScalingImpl(DistributedOperatorImpl):
    def __init__(self, name):
        super(DistributedUpdateLossScalingImpl, self).__init__(name)
        self._name = name

--- a/python/paddle/distributed/auto_parallel/parallelizer.py
+++ b/python/paddle/distributed/auto_parallel/parallelizer.py
@@ -108,8 +108,8 @@ class AutoParallelizer:
            if config["use_pure_fp16"]:
                config["base_opt"] = self._optimizer
                auto_parallel_fp16_pass = new_pass("auto_parallel_fp16", config)
-                auto_parallel_fp16_pass.apply(
+                auto_parallel_fp16_pass.apply([main_program], [startup_program],
-                    [main_program], [startup_program], self._pass_context)
+                                              self._pass_context)
            else:
                auto_parallel_amp_pass = new_pass("auto_parallel_amp", config)
                auto_parallel_amp_pass.apply([main_program], [startup_program],
@@ -123,8 +123,9 @@ class AutoParallelizer:
            config["loss"] = loss
            auto_parallel_recompute_pass = new_pass("auto_parallel_recompute",
                                                    config)
-            auto_parallel_recompute_pass.apply(
+            auto_parallel_recompute_pass.apply([main_program],
-                [main_program], [startup_program], self._pass_context)
+                                               [startup_program],
+                                               self._pass_context)
    def _generate_backward(self, main_program, startup_program, loss,
                           parameter_list, no_grad_set, callbacks):
@@ -144,10 +145,10 @@ class AutoParallelizer:
    def _apply_optimize(self, main_program, startup_program, params_grads):
        with program_guard(main_program, startup_program):
-            optimize_ops = copy.deepcopy(self._optimizer).apply_gradients(
+            optimize_ops = copy.deepcopy(
-                params_grads)
+                self._optimizer).apply_gradients(params_grads)
-        # update completion 
+        # update completion
        self._completer = Completer(self._dist_context)
        self._completer.complete_update_annotation(main_program)
@@ -163,8 +164,8 @@ class AutoParallelizer:
            config["global_rank"] = rank
            auto_parallel_sharding_pass = new_pass("auto_parallel_sharding",
                                                   config)
-            auto_parallel_sharding_pass.apply(
+            auto_parallel_sharding_pass.apply([main_program], [startup_program],
-                [main_program], [startup_program], self._pass_context)
+                                              self._pass_context)
        if self._dist_strategy.gradient_merge:
            config = copy.deepcopy(self._dist_strategy.gradient_merge_configs)
@@ -172,8 +173,9 @@ class AutoParallelizer:
            config["params_grads"] = params_grads
            auto_parallel_gradient_merge_pass = new_pass(
                "auto_parallel_gradient_merge_pass", config)
-            auto_parallel_gradient_merge_pass.apply(
+            auto_parallel_gradient_merge_pass.apply([main_program],
-                [main_program], [startup_program], self._pass_context)
+                                                    [startup_program],
+                                                    self._pass_context)
    def _get_dist_program(self, rank, dist_context=None, relaunch_phase=False):
        completed_main_program = None
@@ -181,7 +183,7 @@ class AutoParallelizer:
        serial_startup_program = self._startup_program.clone()
        serial_loss = serial_main_program.global_block().var(self._loss.name)
-        # generating serial 
+        # generating serial
        if dist_context is None:
            # Annotation completion
            self._dist_context = DistributedContext()
@@ -205,15 +207,16 @@ class AutoParallelizer:
        self._apply_pre_optimization_passes(completed_main_program,
                                            serial_startup_program, serial_loss,
                                            params_grads, self._no_grad_set)
-        # Logical partition 
+        # Logical partition
        partitioner = Partitioner(self._dist_context, rank)
        dist_main_prog, dist_startup_prog, dist_params_grads = partitioner.partition(
            completed_main_program, serial_startup_program, params_grads)
        # TODO refactor the placement of optimizer
        # generate optimize program
-        dist_optimize_ops = self._apply_optimize(
+        dist_optimize_ops = self._apply_optimize(dist_main_prog,
-            dist_main_prog, dist_startup_prog, dist_params_grads)
+                                                 dist_startup_prog,
+                                                 dist_params_grads)
        set_grad_var_shape(dist_main_prog, self._dist_context)
@@ -258,14 +261,17 @@ class AutoParallelizer:
            # auto search
            if self._dist_strategy.auto_search:
                logging.info("Start searching dist attr.")
-                serial_program_info = SerialProgramInfo(
+                serial_program_info = SerialProgramInfo(self._main_program,
-                    self._main_program, self._startup_program, self._loss,
+                                                        self._startup_program,
-                    self._optimizer, self._cluster)
+                                                        self._loss,
-                planner = Planner(
+                                                        self._optimizer,
-                    serial_program_info,
+                                                        self._cluster)
-                    self,
+                planner = Planner(serial_program_info,
-                    algorithm_config={"name": "mcmc",
+                                  self,
-                                      "max_search_times": 5})
+                                  algorithm_config={
+                                      "name": "mcmc",
+                                      "max_search_times": 5
+                                  })
                dist_context, _ = planner.search()
                logging.info("End searching dist attr.")
@@ -325,8 +331,8 @@ class AutoParallelizer:
            else:
                coverage_args = []
            new_cmd_args = "-m paddle.distributed.fleet.launch" + " " + rank_mapping_args + " " + original_cmd_args
-            new_cmd = [sys.executable, "-u"] + coverage_args + shlex.split(
+            new_cmd = [sys.executable, "-u"
-                new_cmd_args)
+                       ] + coverage_args + shlex.split(new_cmd_args)
            new_process = subprocess.Popen(new_cmd)
            new_process.wait()
            assert new_process.returncode == 0, \
@@ -368,13 +374,12 @@ class AutoParallelizer:
                        self._loss,
                        self._optimizer,
                        cluster=self._cluster)
-                    planner = Planner(
+                    planner = Planner(serial_program_info,
-                        serial_program_info,
+                                      self,
-                        self,
+                                      algorithm_config={
-                        algorithm_config={
+                                          "name": "mcmc",
-                            "name": "mcmc",
+                                          "max_search_times": 5
-                            "max_search_times": 5
+                                      })
-                        })
                    dist_context, _ = planner.search()
            # rebuild g_process_group

--- a/python/paddle/distributed/auto_parallel/parallelizer_v2.py
+++ b/python/paddle/distributed/auto_parallel/parallelizer_v2.py
--- a/python/paddle/distributed/auto_parallel/partitioner.py
+++ b/python/paddle/distributed/auto_parallel/partitioner.py
--- a/python/paddle/distributed/auto_parallel/planner.py
+++ b/python/paddle/distributed/auto_parallel/planner.py
--- a/python/paddle/distributed/auto_parallel/planner_v2.py
+++ b/python/paddle/distributed/auto_parallel/planner_v2.py
@@ -20,6 +20,7 @@ from .utils import print_program_with_dist_attr
 class Planner:
    def __init__(self, mode, dist_context):
        self._mode = mode
        self._dist_context = dist_context

--- a/python/paddle/distributed/auto_parallel/process_group.py
+++ b/python/paddle/distributed/auto_parallel/process_group.py
--- a/python/paddle/distributed/auto_parallel/process_mesh.py
+++ b/python/paddle/distributed/auto_parallel/process_mesh.py
--- a/python/paddle/distributed/auto_parallel/reshard.py
+++ b/python/paddle/distributed/auto_parallel/reshard.py
--- a/python/paddle/distributed/auto_parallel/tuner/recorder.py
+++ b/python/paddle/distributed/auto_parallel/tuner/recorder.py
--- a/python/paddle/distributed/auto_parallel/tuner/storable.py
+++ b/python/paddle/distributed/auto_parallel/tuner/storable.py
--- a/python/paddle/distributed/auto_parallel/tuner/trial.py
+++ b/python/paddle/distributed/auto_parallel/tuner/trial.py
--- a/python/paddle/distributed/auto_parallel/tuner/tunable_space.py
+++ b/python/paddle/distributed/auto_parallel/tuner/tunable_space.py
--- a/python/paddle/distributed/auto_parallel/tuner/tunable_variable.py
+++ b/python/paddle/distributed/auto_parallel/tuner/tunable_variable.py
--- a/python/paddle/distributed/auto_parallel/utils.py
+++ b/python/paddle/distributed/auto_parallel/utils.py
--- a/python/paddle/distributed/cloud_utils.py
+++ b/python/paddle/distributed/cloud_utils.py
--- a/python/paddle/distributed/collective.py
+++ b/python/paddle/distributed/collective.py
--- a/python/paddle/distributed/elastic.py
+++ b/python/paddle/distributed/elastic.py
--- a/python/paddle/distributed/fleet/__init__.py
+++ b/python/paddle/distributed/fleet/__init__.py
--- a/python/paddle/distributed/fleet/base/distributed_strategy.py
+++ b/python/paddle/distributed/fleet/base/distributed_strategy.py
--- a/python/paddle/distributed/fleet/base/fleet_base.py
+++ b/python/paddle/distributed/fleet/base/fleet_base.py
--- a/python/paddle/distributed/fleet/base/meta_optimizer_factory.py
+++ b/python/paddle/distributed/fleet/base/meta_optimizer_factory.py
--- a/python/paddle/distributed/fleet/base/role_maker.py
+++ b/python/paddle/distributed/fleet/base/role_maker.py
--- a/python/paddle/distributed/fleet/base/runtime_factory.py
+++ b/python/paddle/distributed/fleet/base/runtime_factory.py
--- a/python/paddle/distributed/fleet/base/strategy_compiler.py
+++ b/python/paddle/distributed/fleet/base/strategy_compiler.py
--- a/python/paddle/distributed/fleet/base/topology.py
+++ b/python/paddle/distributed/fleet/base/topology.py
--- a/python/paddle/distributed/fleet/base/util_factory.py
+++ b/python/paddle/distributed/fleet/base/util_factory.py
--- a/python/paddle/distributed/fleet/cloud_utils.py
+++ b/python/paddle/distributed/fleet/cloud_utils.py
--- a/python/paddle/distributed/fleet/data_generator/data_generator.py
+++ b/python/paddle/distributed/fleet/data_generator/data_generator.py
--- a/python/paddle/distributed/fleet/dataset/dataset.py
+++ b/python/paddle/distributed/fleet/dataset/dataset.py
--- a/python/paddle/distributed/fleet/dataset/index_dataset.py
+++ b/python/paddle/distributed/fleet/dataset/index_dataset.py
--- a/python/paddle/distributed/fleet/elastic/__init__.py
+++ b/python/paddle/distributed/fleet/elastic/__init__.py
--- a/python/paddle/distributed/fleet/elastic/collective.py
+++ b/python/paddle/distributed/fleet/elastic/collective.py
--- a/python/paddle/distributed/fleet/elastic/manager.py
+++ b/python/paddle/distributed/fleet/elastic/manager.py
--- a/python/paddle/distributed/fleet/fleet_executor_utils.py
+++ b/python/paddle/distributed/fleet/fleet_executor_utils.py
--- a/python/paddle/distributed/fleet/launch.py
+++ b/python/paddle/distributed/fleet/launch.py
--- a/python/paddle/distributed/fleet/launch_utils.py
+++ b/python/paddle/distributed/fleet/launch_utils.py
--- a/python/paddle/distributed/fleet/meta_optimizers/amp_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/amp_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/ascend/__init__.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/ascend/__init__.py
--- a/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_parser.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_parser.py
--- a/python/paddle/distributed/fleet/meta_optimizers/asp_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/asp_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/common.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/common.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dgc_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dgc_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/dygraph_sharding_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/dygraph_sharding_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_gradscaler.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_gradscaler.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/sharding_optimizer_stage2.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/sharding_optimizer_stage2.py
--- a/python/paddle/distributed/fleet/meta_optimizers/fp16_allreduce_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/fp16_allreduce_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/gradient_merge_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/gradient_merge_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/graph_execution_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/graph_execution_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/lamb_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/lamb_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/lars_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/lars_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/localsgd_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/localsgd_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/meta_optimizer_base.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/meta_optimizer_base.py
--- a/python/paddle/distributed/fleet/meta_optimizers/parameter_server_graph_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/parameter_server_graph_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/parameter_server_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/parameter_server_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/pipeline_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/pipeline_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/ps_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/ps_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/raw_program_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/raw_program_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/recompute_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/recompute_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/__init__.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/__init__.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/fp16_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/fp16_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/gradient_clip_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/gradient_clip_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/offload_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/offload_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/prune.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/prune.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/shard.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/shard.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/utils.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/utils.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/weight_decay_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/weight_decay_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/tensor_parallel_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/tensor_parallel_optimizer.py
--- a/python/paddle/distributed/fleet/meta_parallel/meta_parallel_base.py
+++ b/python/paddle/distributed/fleet/meta_parallel/meta_parallel_base.py
--- a/python/paddle/distributed/fleet/meta_parallel/parallel_layers/mp_layers.py
+++ b/python/paddle/distributed/fleet/meta_parallel/parallel_layers/mp_layers.py
--- a/python/paddle/distributed/fleet/meta_parallel/parallel_layers/pp_layers.py
+++ b/python/paddle/distributed/fleet/meta_parallel/parallel_layers/pp_layers.py
--- a/python/paddle/distributed/fleet/meta_parallel/parallel_layers/random.py
+++ b/python/paddle/distributed/fleet/meta_parallel/parallel_layers/random.py
--- a/python/paddle/distributed/fleet/meta_parallel/pipeline_parallel.py
+++ b/python/paddle/distributed/fleet/meta_parallel/pipeline_parallel.py
--- a/python/paddle/distributed/fleet/meta_parallel/pp_utils/p2p_communication.py
+++ b/python/paddle/distributed/fleet/meta_parallel/pp_utils/p2p_communication.py
--- a/python/paddle/distributed/fleet/meta_parallel/pp_utils/utils.py
+++ b/python/paddle/distributed/fleet/meta_parallel/pp_utils/utils.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_optimizer_stage2.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_optimizer_stage2.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage2.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage2.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage3.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage3.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_storage.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_storage.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_utils.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_utils.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage2.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage2.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage3.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage3.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_utils.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_utils.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding_parallel.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding_parallel.py
--- a/python/paddle/distributed/fleet/meta_parallel/tensor_parallel.py
+++ b/python/paddle/distributed/fleet/meta_parallel/tensor_parallel.py
--- a/python/paddle/distributed/fleet/runtime/collective_runtime.py
+++ b/python/paddle/distributed/fleet/runtime/collective_runtime.py
--- a/python/paddle/distributed/fleet/runtime/parameter_server_runtime.py
+++ b/python/paddle/distributed/fleet/runtime/parameter_server_runtime.py
--- a/python/paddle/distributed/fleet/runtime/runtime_base.py
+++ b/python/paddle/distributed/fleet/runtime/runtime_base.py
--- a/python/paddle/distributed/fleet/runtime/the_one_ps.py
+++ b/python/paddle/distributed/fleet/runtime/the_one_ps.py
--- a/python/paddle/distributed/fleet/utils/fs.py
+++ b/python/paddle/distributed/fleet/utils/fs.py
--- a/python/paddle/distributed/fleet/utils/http_server.py
+++ b/python/paddle/distributed/fleet/utils/http_server.py
--- a/python/paddle/distributed/fleet/utils/hybrid_parallel_inference.py
+++ b/python/paddle/distributed/fleet/utils/hybrid_parallel_inference.py
--- a/python/paddle/distributed/fleet/utils/hybrid_parallel_util.py
+++ b/python/paddle/distributed/fleet/utils/hybrid_parallel_util.py
--- a/python/paddle/distributed/fleet/utils/internal_storage.py
+++ b/python/paddle/distributed/fleet/utils/internal_storage.py
--- a/python/paddle/distributed/fleet/utils/log_util.py
+++ b/python/paddle/distributed/fleet/utils/log_util.py
--- a/python/paddle/distributed/fleet/utils/ps_util.py
+++ b/python/paddle/distributed/fleet/utils/ps_util.py
--- a/python/paddle/distributed/fleet/utils/recompute.py
+++ b/python/paddle/distributed/fleet/utils/recompute.py
--- a/python/paddle/distributed/launch/__main__.py
+++ b/python/paddle/distributed/launch/__main__.py
--- a/python/paddle/distributed/launch/context/__init__.py
+++ b/python/paddle/distributed/launch/context/__init__.py
--- a/python/paddle/distributed/launch/context/args_envs.py
+++ b/python/paddle/distributed/launch/context/args_envs.py
--- a/python/paddle/distributed/launch/context/device.py
+++ b/python/paddle/distributed/launch/context/device.py
--- a/python/paddle/distributed/launch/context/event.py
+++ b/python/paddle/distributed/launch/context/event.py
--- a/python/paddle/distributed/launch/context/node.py
+++ b/python/paddle/distributed/launch/context/node.py
--- a/python/paddle/distributed/launch/context/resource.py
+++ b/python/paddle/distributed/launch/context/resource.py
--- a/python/paddle/distributed/launch/context/status.py
+++ b/python/paddle/distributed/launch/context/status.py
--- a/python/paddle/distributed/launch/controllers/collective.py
+++ b/python/paddle/distributed/launch/controllers/collective.py
--- a/python/paddle/distributed/launch/controllers/controller.py
+++ b/python/paddle/distributed/launch/controllers/controller.py
--- a/python/paddle/distributed/launch/controllers/master.py
+++ b/python/paddle/distributed/launch/controllers/master.py
--- a/python/paddle/distributed/launch/controllers/ps.py
+++ b/python/paddle/distributed/launch/controllers/ps.py
--- a/python/paddle/distributed/launch/controllers/watcher.py
+++ b/python/paddle/distributed/launch/controllers/watcher.py
--- a/python/paddle/distributed/launch/job/container.py
+++ b/python/paddle/distributed/launch/job/container.py
--- a/python/paddle/distributed/launch/job/job.py
+++ b/python/paddle/distributed/launch/job/job.py
--- a/python/paddle/distributed/launch/job/pod.py
+++ b/python/paddle/distributed/launch/job/pod.py
--- a/python/paddle/distributed/launch/job/status.py
+++ b/python/paddle/distributed/launch/job/status.py
--- a/python/paddle/distributed/launch/main.py
+++ b/python/paddle/distributed/launch/main.py
--- a/python/paddle/distributed/launch/plugins/__init__.py
+++ b/python/paddle/distributed/launch/plugins/__init__.py
--- a/python/paddle/distributed/launch/utils/kv_client.py
+++ b/python/paddle/distributed/launch/utils/kv_client.py
--- a/python/paddle/distributed/launch/utils/kv_server.py
+++ b/python/paddle/distributed/launch/utils/kv_server.py
--- a/python/paddle/distributed/launch/utils/nvsmi.py
+++ b/python/paddle/distributed/launch/utils/nvsmi.py
--- a/python/paddle/distributed/launch/utils/process_context.py
+++ b/python/paddle/distributed/launch/utils/process_context.py
--- a/python/paddle/distributed/metric/__init__.py
+++ b/python/paddle/distributed/metric/__init__.py
--- a/python/paddle/distributed/metric/metrics.py
+++ b/python/paddle/distributed/metric/metrics.py
--- a/python/paddle/distributed/models/__init__.py
+++ b/python/paddle/distributed/models/__init__.py
--- a/python/paddle/distributed/models/moe/__init__.py
+++ b/python/paddle/distributed/models/moe/__init__.py
--- a/python/paddle/distributed/models/moe/utils.py
+++ b/python/paddle/distributed/models/moe/utils.py
--- a/python/paddle/distributed/parallel.py
+++ b/python/paddle/distributed/parallel.py
--- a/python/paddle/distributed/parallel_with_gloo.py
+++ b/python/paddle/distributed/parallel_with_gloo.py
--- a/python/paddle/distributed/passes/__init__.py
+++ b/python/paddle/distributed/passes/__init__.py
--- a/python/paddle/distributed/passes/auto_parallel_amp.py
+++ b/python/paddle/distributed/passes/auto_parallel_amp.py
--- a/python/paddle/distributed/passes/auto_parallel_fp16.py
+++ b/python/paddle/distributed/passes/auto_parallel_fp16.py
--- a/python/paddle/distributed/passes/auto_parallel_gradient_merge.py
+++ b/python/paddle/distributed/passes/auto_parallel_gradient_merge.py
--- a/python/paddle/distributed/passes/auto_parallel_recompute.py
+++ b/python/paddle/distributed/passes/auto_parallel_recompute.py
--- a/python/paddle/distributed/passes/auto_parallel_sharding.py
+++ b/python/paddle/distributed/passes/auto_parallel_sharding.py
--- a/python/paddle/distributed/passes/cpp_pass.py
+++ b/python/paddle/distributed/passes/cpp_pass.py
--- a/python/paddle/distributed/passes/fuse_all_reduce.py
+++ b/python/paddle/distributed/passes/fuse_all_reduce.py
--- a/python/paddle/distributed/passes/pass_base.py
+++ b/python/paddle/distributed/passes/pass_base.py
--- a/python/paddle/distributed/passes/pass_utils.py
+++ b/python/paddle/distributed/passes/pass_utils.py
--- a/python/paddle/distributed/passes/ps_server_pass.py
+++ b/python/paddle/distributed/passes/ps_server_pass.py
--- a/python/paddle/distributed/passes/ps_trainer_pass.py
+++ b/python/paddle/distributed/passes/ps_trainer_pass.py
--- a/python/paddle/distributed/ps/the_one_ps.py
+++ b/python/paddle/distributed/ps/the_one_ps.py
--- a/python/paddle/distributed/ps/utils/ps_factory.py
+++ b/python/paddle/distributed/ps/utils/ps_factory.py
--- a/python/paddle/distributed/ps/utils/ps_infer_utils.py
+++ b/python/paddle/distributed/ps/utils/ps_infer_utils.py
--- a/python/paddle/distributed/ps/utils/ps_program_builder.py
+++ b/python/paddle/distributed/ps/utils/ps_program_builder.py
--- a/python/paddle/distributed/ps/utils/public.py
+++ b/python/paddle/distributed/ps/utils/public.py
--- a/python/paddle/distributed/sharding/__init__.py
+++ b/python/paddle/distributed/sharding/__init__.py
--- a/python/paddle/distributed/sharding/group_sharded.py
+++ b/python/paddle/distributed/sharding/group_sharded.py
--- a/python/paddle/distributed/spawn.py
+++ b/python/paddle/distributed/spawn.py
--- a/python/paddle/distributed/utils.py
+++ b/python/paddle/distributed/utils.py
--- a/python/paddle/distribution/__init__.py
+++ b/python/paddle/distribution/__init__.py
--- a/python/paddle/distribution/categorical.py
+++ b/python/paddle/distribution/categorical.py
--- a/python/paddle/distribution/constraint.py
+++ b/python/paddle/distribution/constraint.py
--- a/python/paddle/distribution/dirichlet.py
+++ b/python/paddle/distribution/dirichlet.py
--- a/python/paddle/distribution/distribution.py
+++ b/python/paddle/distribution/distribution.py
--- a/python/paddle/distribution/exponential_family.py
+++ b/python/paddle/distribution/exponential_family.py
--- a/python/paddle/distribution/independent.py
+++ b/python/paddle/distribution/independent.py
--- a/python/paddle/distribution/kl.py
+++ b/python/paddle/distribution/kl.py
--- a/python/paddle/distribution/multinomial.py
+++ b/python/paddle/distribution/multinomial.py
--- a/python/paddle/distribution/normal.py
+++ b/python/paddle/distribution/normal.py
--- a/python/paddle/distribution/transform.py
+++ b/python/paddle/distribution/transform.py
--- a/python/paddle/distribution/transformed_distribution.py
+++ b/python/paddle/distribution/transformed_distribution.py
--- a/python/paddle/distribution/uniform.py
+++ b/python/paddle/distribution/uniform.py
--- a/python/paddle/distribution/variable.py
+++ b/python/paddle/distribution/variable.py
--- a/python/paddle/fft.py
+++ b/python/paddle/fft.py
--- a/python/paddle/fluid/__init__.py
+++ b/python/paddle/fluid/__init__.py
--- a/python/paddle/fluid/average.py
+++ b/python/paddle/fluid/average.py
--- a/python/paddle/fluid/backward.py
+++ b/python/paddle/fluid/backward.py
--- a/python/paddle/fluid/clip.py
+++ b/python/paddle/fluid/clip.py
--- a/python/paddle/fluid/communicator.py
+++ b/python/paddle/fluid/communicator.py
--- a/python/paddle/fluid/compiler.py
+++ b/python/paddle/fluid/compiler.py
--- a/python/paddle/fluid/contrib/decoder/beam_search_decoder.py
+++ b/python/paddle/fluid/contrib/decoder/beam_search_decoder.py
--- a/python/paddle/fluid/contrib/extend_optimizer/extend_optimizer_with_weight_decay.py
+++ b/python/paddle/fluid/contrib/extend_optimizer/extend_optimizer_with_weight_decay.py
--- a/python/paddle/fluid/contrib/layers/metric_op.py
+++ b/python/paddle/fluid/contrib/layers/metric_op.py
--- a/python/paddle/fluid/contrib/layers/nn.py
+++ b/python/paddle/fluid/contrib/layers/nn.py
--- a/python/paddle/fluid/contrib/layers/rnn_impl.py
+++ b/python/paddle/fluid/contrib/layers/rnn_impl.py
--- a/python/paddle/fluid/contrib/mixed_precision/amp_nn.py
+++ b/python/paddle/fluid/contrib/mixed_precision/amp_nn.py
--- a/python/paddle/fluid/contrib/mixed_precision/bf16/amp_utils.py
+++ b/python/paddle/fluid/contrib/mixed_precision/bf16/amp_utils.py
--- a/python/paddle/fluid/contrib/mixed_precision/bf16/decorator.py
+++ b/python/paddle/fluid/contrib/mixed_precision/bf16/decorator.py
--- a/python/paddle/fluid/contrib/mixed_precision/decorator.py
+++ b/python/paddle/fluid/contrib/mixed_precision/decorator.py
--- a/python/paddle/fluid/contrib/mixed_precision/fp16_utils.py
+++ b/python/paddle/fluid/contrib/mixed_precision/fp16_utils.py
--- a/python/paddle/fluid/contrib/model_stat.py
+++ b/python/paddle/fluid/contrib/model_stat.py
--- a/python/paddle/fluid/contrib/op_frequence.py
+++ b/python/paddle/fluid/contrib/op_frequence.py
--- a/python/paddle/fluid/contrib/optimizer.py
+++ b/python/paddle/fluid/contrib/optimizer.py
--- a/python/paddle/fluid/contrib/quantize/quantize_transpiler.py
+++ b/python/paddle/fluid/contrib/quantize/quantize_transpiler.py
--- a/python/paddle/fluid/contrib/slim/quantization/adaround.py
+++ b/python/paddle/fluid/contrib/slim/quantization/adaround.py
--- a/python/paddle/fluid/contrib/slim/quantization/cal_kl_threshold.py
+++ b/python/paddle/fluid/contrib/slim/quantization/cal_kl_threshold.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/fuse_utils.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/fuse_utils.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/ptq.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/ptq.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_quantizer.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_quantizer.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/qat.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/qat.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/utils.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/utils.py
--- a/python/paddle/fluid/contrib/slim/quantization/post_training_quantization.py
+++ b/python/paddle/fluid/contrib/slim/quantization/post_training_quantization.py
--- a/python/paddle/fluid/contrib/slim/quantization/quant2_int8_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quant2_int8_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/quantization/quant_int8_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quant_int8_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/quantization/quantization_pass.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quantization_pass.py
--- a/python/paddle/fluid/contrib/slim/quantization/quantize_transpiler_v2.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quantize_transpiler_v2.py
--- a/python/paddle/fluid/contrib/slim/tests/convert_model2dot.py
+++ b/python/paddle/fluid/contrib/slim/tests/convert_model2dot.py
--- a/python/paddle/fluid/contrib/slim/tests/imperative_test_utils.py
+++ b/python/paddle/fluid/contrib/slim/tests/imperative_test_utils.py
--- a/python/paddle/fluid/contrib/slim/tests/quant2_int8_image_classification_comparison.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant2_int8_image_classification_comparison.py
--- a/python/paddle/fluid/contrib/slim/tests/quant2_int8_lstm_model.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant2_int8_lstm_model.py
--- a/python/paddle/fluid/contrib/slim/tests/quant2_int8_nlp_comparison.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant2_int8_nlp_comparison.py
--- a/python/paddle/fluid/contrib/slim/tests/quant_int8_image_classification_comparison.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant_int8_image_classification_comparison.py
--- a/python/paddle/fluid/contrib/slim/tests/save_quant_model.py
+++ b/python/paddle/fluid/contrib/slim/tests/save_quant_model.py
--- a/python/paddle/fluid/contrib/slim/tests/test_graph.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_graph.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_out_scale.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_out_scale.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_ptq.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_ptq.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_amp.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_amp.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_channelwise.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_channelwise.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_fuse.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_fuse.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_user_defined.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_user_defined.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_skip_op.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_skip_op.py
--- a/python/paddle/fluid/contrib/slim/tests/test_moving_average_abs_max_scale_op.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_moving_average_abs_max_scale_op.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_lstm_model.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_lstm_model.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mnist.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mnist.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mobilenetv1.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mobilenetv1.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_resnet50.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_resnet50.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_while.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_while.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quant2_int8_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quant2_int8_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantization_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantization_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantization_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantization_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantization_scale_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantization_scale_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantize_transpiler_v2.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantize_transpiler_v2.py
--- a/python/paddle/fluid/contrib/slim/tests/test_user_defined_quantization.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_user_defined_quantization.py
--- a/python/paddle/fluid/contrib/slim/tests/test_weight_quantization_mobilenetv1.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_weight_quantization_mobilenetv1.py
--- a/python/paddle/fluid/contrib/sparsity/__init__.py
+++ b/python/paddle/fluid/contrib/sparsity/__init__.py
--- a/python/paddle/fluid/contrib/sparsity/asp.py
+++ b/python/paddle/fluid/contrib/sparsity/asp.py
--- a/python/paddle/fluid/contrib/sparsity/supported_layer_list.py
+++ b/python/paddle/fluid/contrib/sparsity/supported_layer_list.py
--- a/python/paddle/fluid/contrib/sparsity/utils.py
+++ b/python/paddle/fluid/contrib/sparsity/utils.py
--- a/python/paddle/fluid/contrib/tests/test_amp_list.py
+++ b/python/paddle/fluid/contrib/tests/test_amp_list.py
--- a/python/paddle/fluid/contrib/tests/test_bf16_utils.py
+++ b/python/paddle/fluid/contrib/tests/test_bf16_utils.py
--- a/python/paddle/fluid/contrib/tests/test_correlation.py
+++ b/python/paddle/fluid/contrib/tests/test_correlation.py
--- a/python/paddle/fluid/contrib/tests/test_fp16_utils.py
+++ b/python/paddle/fluid/contrib/tests/test_fp16_utils.py
--- a/python/paddle/fluid/contrib/tests/test_image_classification_fp16.py
+++ b/python/paddle/fluid/contrib/tests/test_image_classification_fp16.py
--- a/python/paddle/fluid/contrib/tests/test_model_cast_to_bf16.py
+++ b/python/paddle/fluid/contrib/tests/test_model_cast_to_bf16.py
--- a/python/paddle/fluid/contrib/tests/test_multi_precision_fp16_train.py
+++ b/python/paddle/fluid/contrib/tests/test_multi_precision_fp16_train.py
--- a/python/paddle/fluid/contrib/tests/test_quantize_transpiler.py
+++ b/python/paddle/fluid/contrib/tests/test_quantize_transpiler.py
--- a/python/paddle/fluid/contrib/tests/test_weight_decay_extend.py
+++ b/python/paddle/fluid/contrib/tests/test_weight_decay_extend.py
--- a/python/paddle/fluid/core.py
+++ b/python/paddle/fluid/core.py
--- a/python/paddle/fluid/data.py
+++ b/python/paddle/fluid/data.py
--- a/python/paddle/fluid/data_feed_desc.py
+++ b/python/paddle/fluid/data_feed_desc.py
--- a/python/paddle/fluid/data_feeder.py
+++ b/python/paddle/fluid/data_feeder.py
--- a/python/paddle/fluid/dataloader/batch_sampler.py
+++ b/python/paddle/fluid/dataloader/batch_sampler.py
--- a/python/paddle/fluid/dataloader/dataloader_iter.py
+++ b/python/paddle/fluid/dataloader/dataloader_iter.py
--- a/python/paddle/fluid/dataloader/fetcher.py
+++ b/python/paddle/fluid/dataloader/fetcher.py
--- a/python/paddle/fluid/dataloader/sampler.py
+++ b/python/paddle/fluid/dataloader/sampler.py
--- a/python/paddle/fluid/dataloader/worker.py
+++ b/python/paddle/fluid/dataloader/worker.py
--- a/python/paddle/fluid/dataset.py
+++ b/python/paddle/fluid/dataset.py
--- a/python/paddle/fluid/debugger.py
+++ b/python/paddle/fluid/debugger.py
--- a/python/paddle/fluid/device_worker.py
+++ b/python/paddle/fluid/device_worker.py
--- a/python/paddle/fluid/distributed/downpour.py
+++ b/python/paddle/fluid/distributed/downpour.py
--- a/python/paddle/fluid/distributed/fleet.py
+++ b/python/paddle/fluid/distributed/fleet.py
--- a/python/paddle/fluid/distributed/ps_pb2.py
+++ b/python/paddle/fluid/distributed/ps_pb2.py
--- a/python/paddle/fluid/dygraph/amp/auto_cast.py
+++ b/python/paddle/fluid/dygraph/amp/auto_cast.py
--- a/python/paddle/fluid/dygraph/amp/loss_scaler.py
+++ b/python/paddle/fluid/dygraph/amp/loss_scaler.py
--- a/python/paddle/fluid/dygraph/base.py
+++ b/python/paddle/fluid/dygraph/base.py
--- a/python/paddle/fluid/dygraph/checkpoint.py
+++ b/python/paddle/fluid/dygraph/checkpoint.py
--- a/python/paddle/fluid/dygraph/container.py
+++ b/python/paddle/fluid/dygraph/container.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/break_continue_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/break_continue_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/cast_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/cast_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/convert_call_func.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/convert_call_func.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/convert_operators.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/convert_operators.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/error.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/error.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/function_spec.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/function_spec.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/grad_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/grad_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/ifelse_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/ifelse_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/logging_utils.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/logging_utils.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/loop_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/loop_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/origin_info.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/origin_info.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/partial_program.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/partial_program.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/program_translator.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/program_translator.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/return_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/return_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/static_analysis.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/static_analysis.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/tensor_shape_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/tensor_shape_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/utils.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/utils.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/variable_trans_func.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/variable_trans_func.py
--- a/python/paddle/fluid/dygraph/inplace_utils.py
+++ b/python/paddle/fluid/dygraph/inplace_utils.py
--- a/python/paddle/fluid/dygraph/io.py
+++ b/python/paddle/fluid/dygraph/io.py
--- a/python/paddle/fluid/dygraph/jit.py
+++ b/python/paddle/fluid/dygraph/jit.py
--- a/python/paddle/fluid/dygraph/layer_hooks.py
+++ b/python/paddle/fluid/dygraph/layer_hooks.py
--- a/python/paddle/fluid/dygraph/layer_object_helper.py
+++ b/python/paddle/fluid/dygraph/layer_object_helper.py
--- a/python/paddle/fluid/dygraph/layers.py
+++ b/python/paddle/fluid/dygraph/layers.py
--- a/python/paddle/fluid/dygraph/learning_rate_scheduler.py
+++ b/python/paddle/fluid/dygraph/learning_rate_scheduler.py
--- a/python/paddle/fluid/dygraph/math_op_patch.py
+++ b/python/paddle/fluid/dygraph/math_op_patch.py
--- a/python/paddle/fluid/dygraph/nn.py
+++ b/python/paddle/fluid/dygraph/nn.py
--- a/python/paddle/fluid/dygraph/parallel.py
+++ b/python/paddle/fluid/dygraph/parallel.py
--- a/python/paddle/fluid/dygraph/parallel_helper.py
+++ b/python/paddle/fluid/dygraph/parallel_helper.py
--- a/python/paddle/fluid/dygraph/rnn.py
+++ b/python/paddle/fluid/dygraph/rnn.py
--- a/python/paddle/fluid/dygraph/tracer.py
+++ b/python/paddle/fluid/dygraph/tracer.py
--- a/python/paddle/fluid/dygraph/varbase_patch_methods.py
+++ b/python/paddle/fluid/dygraph/varbase_patch_methods.py
--- a/python/paddle/fluid/entry_attr.py
+++ b/python/paddle/fluid/entry_attr.py
--- a/python/paddle/fluid/evaluator.py
+++ b/python/paddle/fluid/evaluator.py
--- a/python/paddle/fluid/executor.py
+++ b/python/paddle/fluid/executor.py
--- a/python/paddle/fluid/framework.py
+++ b/python/paddle/fluid/framework.py
--- a/python/paddle/fluid/graphviz.py
+++ b/python/paddle/fluid/graphviz.py
--- a/python/paddle/fluid/incubate/checkpoint/auto_checkpoint.py
+++ b/python/paddle/fluid/incubate/checkpoint/auto_checkpoint.py
--- a/python/paddle/fluid/incubate/checkpoint/checkpoint_saver.py
+++ b/python/paddle/fluid/incubate/checkpoint/checkpoint_saver.py
--- a/python/paddle/fluid/incubate/data_generator/__init__.py
+++ b/python/paddle/fluid/incubate/data_generator/__init__.py
--- a/python/paddle/fluid/incubate/fleet/base/role_maker.py
+++ b/python/paddle/fluid/incubate/fleet/base/role_maker.py
--- a/python/paddle/fluid/incubate/fleet/collective/__init__.py
+++ b/python/paddle/fluid/incubate/fleet/collective/__init__.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/__init__.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/__init__.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/distributed_strategy.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/distributed_strategy.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/heter_trainer_pass.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/heter_trainer_pass.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/pserver_pass.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/pserver_pass.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/public.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/public.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/trainer_pass.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/trainer_pass.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/vars_metatools.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/vars_metatools.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/__init__.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/__init__.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/node.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/node.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/ps_pb2.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/ps_pb2.py
--- a/python/paddle/fluid/incubate/fleet/tests/ctr_dataset_reader.py
+++ b/python/paddle/fluid/incubate/fleet/tests/ctr_dataset_reader.py
--- a/python/paddle/fluid/incubate/fleet/tests/fleet_deep_ctr.py
+++ b/python/paddle/fluid/incubate/fleet/tests/fleet_deep_ctr.py
--- a/python/paddle/fluid/incubate/fleet/utils/fleet_util.py
+++ b/python/paddle/fluid/incubate/fleet/utils/fleet_util.py
--- a/python/paddle/fluid/incubate/fleet/utils/hdfs.py
+++ b/python/paddle/fluid/incubate/fleet/utils/hdfs.py
--- a/python/paddle/fluid/incubate/fleet/utils/http_server.py
+++ b/python/paddle/fluid/incubate/fleet/utils/http_server.py
--- a/python/paddle/fluid/incubate/fleet/utils/utils.py
+++ b/python/paddle/fluid/incubate/fleet/utils/utils.py
--- a/python/paddle/fluid/inference/wrapper.py
+++ b/python/paddle/fluid/inference/wrapper.py
--- a/python/paddle/fluid/initializer.py
+++ b/python/paddle/fluid/initializer.py
--- a/python/paddle/fluid/input.py
+++ b/python/paddle/fluid/input.py
--- a/python/paddle/fluid/install_check.py
+++ b/python/paddle/fluid/install_check.py
--- a/python/paddle/fluid/io.py
+++ b/python/paddle/fluid/io.py
--- a/python/paddle/fluid/ir.py
+++ b/python/paddle/fluid/ir.py
--- a/python/paddle/fluid/layer_helper.py
+++ b/python/paddle/fluid/layer_helper.py
--- a/python/paddle/fluid/layer_helper_base.py
+++ b/python/paddle/fluid/layer_helper_base.py
--- a/python/paddle/fluid/layers/collective.py
+++ b/python/paddle/fluid/layers/collective.py
--- a/python/paddle/fluid/layers/control_flow.py
+++ b/python/paddle/fluid/layers/control_flow.py
--- a/python/paddle/fluid/layers/detection.py
+++ b/python/paddle/fluid/layers/detection.py
--- a/python/paddle/fluid/layers/device.py
+++ b/python/paddle/fluid/layers/device.py
--- a/python/paddle/fluid/layers/distributions.py
+++ b/python/paddle/fluid/layers/distributions.py
--- a/python/paddle/fluid/layers/io.py
+++ b/python/paddle/fluid/layers/io.py
--- a/python/paddle/fluid/layers/layer_function_generator.py
+++ b/python/paddle/fluid/layers/layer_function_generator.py
--- a/python/paddle/fluid/layers/learning_rate_scheduler.py
+++ b/python/paddle/fluid/layers/learning_rate_scheduler.py
--- a/python/paddle/fluid/layers/loss.py
+++ b/python/paddle/fluid/layers/loss.py
--- a/python/paddle/fluid/layers/math_op_patch.py
+++ b/python/paddle/fluid/layers/math_op_patch.py
--- a/python/paddle/fluid/layers/metric_op.py
+++ b/python/paddle/fluid/layers/metric_op.py
--- a/python/paddle/fluid/layers/nn.py
+++ b/python/paddle/fluid/layers/nn.py
--- a/python/paddle/fluid/layers/ops.py
+++ b/python/paddle/fluid/layers/ops.py
--- a/python/paddle/fluid/layers/rnn.py
+++ b/python/paddle/fluid/layers/rnn.py
--- a/python/paddle/fluid/layers/sequence_lod.py
+++ b/python/paddle/fluid/layers/sequence_lod.py
--- a/python/paddle/fluid/layers/tensor.py
+++ b/python/paddle/fluid/layers/tensor.py
--- a/python/paddle/fluid/layers/utils.py
+++ b/python/paddle/fluid/layers/utils.py
--- a/python/paddle/fluid/lod_tensor.py
+++ b/python/paddle/fluid/lod_tensor.py
--- a/python/paddle/fluid/memory_analysis.py
+++ b/python/paddle/fluid/memory_analysis.py
--- a/python/paddle/fluid/metrics.py
+++ b/python/paddle/fluid/metrics.py
--- a/python/paddle/fluid/multiprocess_utils.py
+++ b/python/paddle/fluid/multiprocess_utils.py
--- a/python/paddle/fluid/net_drawer.py
+++ b/python/paddle/fluid/net_drawer.py
--- a/python/paddle/fluid/nets.py
+++ b/python/paddle/fluid/nets.py
--- a/python/paddle/fluid/op.py
+++ b/python/paddle/fluid/op.py
--- a/python/paddle/fluid/optimizer.py
+++ b/python/paddle/fluid/optimizer.py
--- a/python/paddle/fluid/param_attr.py
+++ b/python/paddle/fluid/param_attr.py
--- a/python/paddle/fluid/profiler.py
+++ b/python/paddle/fluid/profiler.py
--- a/python/paddle/fluid/reader.py
+++ b/python/paddle/fluid/reader.py
--- a/python/paddle/fluid/regularizer.py
+++ b/python/paddle/fluid/regularizer.py
--- a/python/paddle/fluid/tests/book/notest_understand_sentiment.py
+++ b/python/paddle/fluid/tests/book/notest_understand_sentiment.py
--- a/python/paddle/fluid/tests/book/test_fit_a_line.py
+++ b/python/paddle/fluid/tests/book/test_fit_a_line.py
--- a/python/paddle/fluid/tests/book/test_image_classification.py
+++ b/python/paddle/fluid/tests/book/test_image_classification.py
--- a/python/paddle/fluid/tests/book/test_label_semantic_roles.py
+++ b/python/paddle/fluid/tests/book/test_label_semantic_roles.py
--- a/python/paddle/fluid/tests/book/test_machine_translation.py
+++ b/python/paddle/fluid/tests/book/test_machine_translation.py
--- a/python/paddle/fluid/tests/book/test_recognize_digits.py
+++ b/python/paddle/fluid/tests/book/test_recognize_digits.py
--- a/python/paddle/fluid/tests/book/test_recommender_system.py
+++ b/python/paddle/fluid/tests/book/test_recommender_system.py
--- a/python/paddle/fluid/tests/book/test_rnn_encoder_decoder.py
+++ b/python/paddle/fluid/tests/book/test_rnn_encoder_decoder.py
--- a/python/paddle/fluid/tests/book/test_word2vec_book.py
+++ b/python/paddle/fluid/tests/book/test_word2vec_book.py
--- a/python/paddle/fluid/tests/custom_kernel/custom_kernel_dot_setup.py
+++ b/python/paddle/fluid/tests/custom_kernel/custom_kernel_dot_setup.py
--- a/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_dot.py
+++ b/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_dot.py
--- a/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_load.py
+++ b/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_load.py
--- a/python/paddle/fluid/tests/custom_op/custom_raw_op_kernel_op_setup.py
+++ b/python/paddle/fluid/tests/custom_op/custom_raw_op_kernel_op_setup.py
--- a/python/paddle/fluid/tests/custom_op/test_check_abi.py
+++ b/python/paddle/fluid/tests/custom_op/test_check_abi.py
--- a/python/paddle/fluid/tests/custom_op/test_context_pool.py
+++ b/python/paddle/fluid/tests/custom_op/test_context_pool.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_attrs_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_attrs_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_concat.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_concat.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_conj.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_conj.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_linear.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_linear.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_raw_op_kernel_op.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_raw_op_kernel_op.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_relu_model.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_relu_model.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_relu_op_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_relu_op_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_relu_op_setup.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_relu_op_setup.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_simple_slice.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_simple_slice.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_tanh_double_grad.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_tanh_double_grad.py
--- a/python/paddle/fluid/tests/custom_op/test_dispatch_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_dispatch_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_multi_out_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_multi_out_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_sysconfig.py
+++ b/python/paddle/fluid/tests/custom_op/test_sysconfig.py
--- a/python/paddle/fluid/tests/custom_op/utils.py
+++ b/python/paddle/fluid/tests/custom_op/utils.py
--- a/python/paddle/fluid/tests/test_beam_search_decoder.py
+++ b/python/paddle/fluid/tests/test_beam_search_decoder.py
--- a/python/paddle/fluid/tests/test_data_feeder.py
+++ b/python/paddle/fluid/tests/test_data_feeder.py
--- a/python/paddle/fluid/tests/test_detection.py
+++ b/python/paddle/fluid/tests/test_detection.py
--- a/python/paddle/fluid/tests/test_error_clip.py
+++ b/python/paddle/fluid/tests/test_error_clip.py
--- a/python/paddle/fluid/tests/test_if_else_op.py
+++ b/python/paddle/fluid/tests/test_if_else_op.py
--- a/python/paddle/fluid/tests/test_lod_tensor.py
+++ b/python/paddle/fluid/tests/test_lod_tensor.py
--- a/python/paddle/fluid/tests/test_python_operator_overriding.py
+++ b/python/paddle/fluid/tests/test_python_operator_overriding.py
--- a/python/paddle/fluid/tests/test_sequential.py
+++ b/python/paddle/fluid/tests/test_sequential.py
--- a/python/paddle/fluid/tests/unittests/__init__.py
+++ b/python/paddle/fluid/tests/unittests/__init__.py
--- a/python/paddle/fluid/tests/unittests/ascend_group.py
+++ b/python/paddle/fluid/tests/unittests/ascend_group.py
--- a/python/paddle/fluid/tests/unittests/asp/asp_pruning_base.py
+++ b/python/paddle/fluid/tests/unittests/asp/asp_pruning_base.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_customized_pruning.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_customized_pruning.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_dynamic.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_static.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_static.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_dynamic.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_static.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_static.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_save_load.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_save_load.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_utils.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_utils.py
--- a/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_dynamic.py
--- a/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_sharding.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_sharding.py
--- a/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_static.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_static.py
--- a/python/paddle/fluid/tests/unittests/auto_checkpoint_utils.py
+++ b/python/paddle/fluid/tests/unittests/auto_checkpoint_utils.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_model.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_model.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_gpt_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_gpt_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/engine_api.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/engine_api.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/high_order_grad.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/high_order_grad.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/launch.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/launch.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_auto_parallel_relaunch.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_auto_parallel_relaunch.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_cluster.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_cluster.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_comm_cost.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_comm_cost.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_comp_cost.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_comp_cost.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_converter.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_converter.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_context.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_context.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_pnorm.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_pnorm.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_reshape.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_reshape.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_slice.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_slice.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_api.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_api.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_high_order_grad.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_high_order_grad.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_new_cost_model.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_new_cost_model.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_prim_dist_op.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_prim_dist_op.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_recorder.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_recorder.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_gpt_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_gpt_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_trial.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_trial.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_space.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_space.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_variable.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_variable.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_completion.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_completion.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_partition.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_partition.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_autoconvert.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_autoconvert.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_data_unshard.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_data_unshard.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_gpt_model.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_gpt_model.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_parallelizer.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_parallelizer.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_save_load.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_save_load.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_dynamic.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_static.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_static.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_gradients_and_minimize.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_gradients_and_minimize.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_jvp_and_transpose.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_jvp_and_transpose.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_orig2prim.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_orig2prim.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_prim2orig.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_prim2orig.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_primops.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_primops.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_transform.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_transform.py
--- a/python/paddle/fluid/tests/unittests/autograd/utils.py
+++ b/python/paddle/fluid/tests/unittests/autograd/utils.py
--- a/python/paddle/fluid/tests/unittests/benchmark.py
+++ b/python/paddle/fluid/tests/unittests/benchmark.py
--- a/python/paddle/fluid/tests/unittests/benchmark_sum_op.py
+++ b/python/paddle/fluid/tests/unittests/benchmark_sum_op.py
--- a/python/paddle/fluid/tests/unittests/c_comm_init_op.py
+++ b/python/paddle/fluid/tests/unittests/c_comm_init_op.py
--- a/python/paddle/fluid/tests/unittests/c_embedding_op_base.py
+++ b/python/paddle/fluid/tests/unittests/c_embedding_op_base.py
--- a/python/paddle/fluid/tests/unittests/check_nan_inf_base.py
+++ b/python/paddle/fluid/tests/unittests/check_nan_inf_base.py
--- a/python/paddle/fluid/tests/unittests/check_nan_inf_base_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/check_nan_inf_base_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective_allgather_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_allgather_api.py
--- a/python/paddle/fluid/tests/unittests/collective_allgather_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_allgather_op.py
--- a/python/paddle/fluid/tests/unittests/collective_allreduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_allreduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective_allreduce_new_group_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_allreduce_new_group_api.py
--- a/python/paddle/fluid/tests/unittests/collective_allreduce_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_allreduce_op.py
--- a/python/paddle/fluid/tests/unittests/collective_allreduce_op_wait.py
+++ b/python/paddle/fluid/tests/unittests/collective_allreduce_op_wait.py
--- a/python/paddle/fluid/tests/unittests/collective_alltoall_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_alltoall_api.py
--- a/python/paddle/fluid/tests/unittests/collective_alltoall_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective_alltoall_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective_barrier_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_barrier_api.py
--- a/python/paddle/fluid/tests/unittests/collective_broadcast_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_broadcast_api.py
--- a/python/paddle/fluid/tests/unittests/collective_broadcast_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_broadcast_op.py
--- a/python/paddle/fluid/tests/unittests/collective_concat_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_concat_op.py
--- a/python/paddle/fluid/tests/unittests/collective_global_gather.py
+++ b/python/paddle/fluid/tests/unittests/collective_global_gather.py
--- a/python/paddle/fluid/tests/unittests/collective_global_gather_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective_global_gather_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective_global_scatter.py
+++ b/python/paddle/fluid/tests/unittests/collective_global_scatter.py
--- a/python/paddle/fluid/tests/unittests/collective_global_scatter_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective_global_scatter_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective_identity_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_identity_op.py
--- a/python/paddle/fluid/tests/unittests/collective_reduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_reduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective_reduce_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_reduce_op.py
--- a/python/paddle/fluid/tests/unittests/collective_reduce_op_calc_stream.py
+++ b/python/paddle/fluid/tests/unittests/collective_reduce_op_calc_stream.py
--- a/python/paddle/fluid/tests/unittests/collective_reducescatter.py
+++ b/python/paddle/fluid/tests/unittests/collective_reducescatter.py
--- a/python/paddle/fluid/tests/unittests/collective_reducescatter_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_reducescatter_op.py
--- a/python/paddle/fluid/tests/unittests/collective_scatter_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_scatter_api.py
--- a/python/paddle/fluid/tests/unittests/collective_scatter_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_scatter_op.py
--- a/python/paddle/fluid/tests/unittests/collective_sendrecv_api.py
+++ b/python/paddle/fluid/tests/unittests/collective_sendrecv_api.py
--- a/python/paddle/fluid/tests/unittests/collective_sendrecv_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective_sendrecv_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective_sendrecv_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_sendrecv_op.py
--- a/python/paddle/fluid/tests/unittests/collective_sendrecv_op_array.py
+++ b/python/paddle/fluid/tests/unittests/collective_sendrecv_op_array.py
--- a/python/paddle/fluid/tests/unittests/collective_sendrecv_op_dynamic_shape.py
+++ b/python/paddle/fluid/tests/unittests/collective_sendrecv_op_dynamic_shape.py
--- a/python/paddle/fluid/tests/unittests/collective_split_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_split_op.py
--- a/python/paddle/fluid/tests/unittests/column_parallel_linear_api.py
+++ b/python/paddle/fluid/tests/unittests/column_parallel_linear_api.py
--- a/python/paddle/fluid/tests/unittests/ctr_dataset_reader.py
+++ b/python/paddle/fluid/tests/unittests/ctr_dataset_reader.py
--- a/python/paddle/fluid/tests/unittests/decorator_helper.py
+++ b/python/paddle/fluid/tests/unittests/decorator_helper.py
--- a/python/paddle/fluid/tests/unittests/detected_gpu.py
+++ b/python/paddle/fluid/tests/unittests/detected_gpu.py
--- a/python/paddle/fluid/tests/unittests/detected_xpu.py
+++ b/python/paddle/fluid/tests/unittests/detected_xpu.py
--- a/python/paddle/fluid/tests/unittests/dist_allreduce_op.py
+++ b/python/paddle/fluid/tests/unittests/dist_allreduce_op.py
--- a/python/paddle/fluid/tests/unittests/dist_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_ctr_reader.py
+++ b/python/paddle/fluid/tests/unittests/dist_ctr_reader.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_ctr_ps_gpu.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_ctr_ps_gpu.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_debug_gloo.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_debug_gloo.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_heter_pipeline_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_heter_pipeline_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer_fuse_allreduce.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer_fuse_allreduce.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_simnet_bow.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_simnet_bow.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_sparse_embedding_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_sparse_embedding_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_batch_merge.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_batch_merge.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_fp16_allreduce.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_fp16_allreduce.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_gradient_merge.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_gradient_merge.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_gradient_merge_raw_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_gradient_merge_raw_optimizer.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_lars.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_lars.py
--- a/python/paddle/fluid/tests/unittests/dist_save_load.py
+++ b/python/paddle/fluid/tests/unittests/dist_save_load.py
--- a/python/paddle/fluid/tests/unittests/dist_se_resnext.py
+++ b/python/paddle/fluid/tests/unittests/dist_se_resnext.py
--- a/python/paddle/fluid/tests/unittests/dist_sharding_save.py
+++ b/python/paddle/fluid/tests/unittests/dist_sharding_save.py
--- a/python/paddle/fluid/tests/unittests/dist_text_classification.py
+++ b/python/paddle/fluid/tests/unittests/dist_text_classification.py
--- a/python/paddle/fluid/tests/unittests/dist_transformer.py
+++ b/python/paddle/fluid/tests/unittests/dist_transformer.py
--- a/python/paddle/fluid/tests/unittests/dist_word2vec.py
+++ b/python/paddle/fluid/tests/unittests/dist_word2vec.py
--- a/python/paddle/fluid/tests/unittests/distributed_fused_lamb_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_fused_lamb_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/auto_parallel_pass_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/auto_parallel_pass_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/check_pass_conflict_example.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/check_pass_conflict_example.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/dist_pass_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/dist_pass_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/launch.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/launch.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/model_zoo.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/model_zoo.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/pass_run_main.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/pass_run_main.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/ps_pass_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/ps_pass_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_amp_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_amp_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_fp16_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_fp16_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_recompute_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_recompute_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_sharding_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_sharding_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_build_cinn_pass_resnet.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_build_cinn_pass_resnet.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_build_cinn_pass_simple_net.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_build_cinn_pass_simple_net.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_adam_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_adam_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_all_reduce_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_all_reduce_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_act_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_act_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_add_act_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_add_act_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_momentum_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_momentum_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_relu_depthwise_conv_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_relu_depthwise_conv_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_sgd_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_sgd_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_gradient_merge_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_gradient_merge_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_inplace_addto_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_inplace_addto_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_server_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_server_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_trainer_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_trainer_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_white_lists.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_white_lists.py
--- a/python/paddle/fluid/tests/unittests/distribution/parameterize.py
+++ b/python/paddle/fluid/tests/unittests/distribution/parameterize.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_dirichlet_op.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_dirichlet_op.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta_static.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_categorical.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_categorical.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_constraint.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_constraint.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_dirichlet.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_dirichlet.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_dirichlet_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_dirichlet_static.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_expfamily.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_expfamily.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_expfamily_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_expfamily_static.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_independent.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_independent.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_independent_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_independent_static.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_multinomial.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_multinomial.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_multinomial_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_multinomial_static.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_normal.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_normal.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_transform.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_transform.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_transform_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_transform_static.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_transformed_distribution.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_transformed_distribution.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_transformed_distribution_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_transformed_distribution_static.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_uniform.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_uniform.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_variable.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_variable.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_kl.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_kl.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_kl_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_kl_static.py
--- a/python/paddle/fluid/tests/unittests/dygraph_fleet_api.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_fleet_api.py
--- a/python/paddle/fluid/tests/unittests/dygraph_group_sharded_api.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_group_sharded_api.py
--- a/python/paddle/fluid/tests/unittests/dygraph_group_sharded_api_eager.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_group_sharded_api_eager.py
--- a/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage2.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage2.py
--- a/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage2_offload.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage2_offload.py
--- a/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage3.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage3.py
--- a/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage3_offload.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_group_sharded_stage3_offload.py
--- a/python/paddle/fluid/tests/unittests/dygraph_sharding_optimizer_stage2.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_sharding_optimizer_stage2.py
--- a/python/paddle/fluid/tests/unittests/dygraph_sharding_stage2.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_sharding_stage2.py
--- a/python/paddle/fluid/tests/unittests/dygraph_sharding_stage2_offload.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_sharding_stage2_offload.py
--- a/python/paddle/fluid/tests/unittests/dygraph_sharding_stage3.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_sharding_stage3.py
--- a/python/paddle/fluid/tests/unittests/dygraph_sharding_stage3_offload.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_sharding_stage3_offload.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/bert_dygraph_model.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/bert_dygraph_model.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/bert_utils.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/bert_utils.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/darknet.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/darknet.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/ifelse_simple_func.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/ifelse_simple_func.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/seq2seq_dygraph_model.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/seq2seq_dygraph_model.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/seq2seq_utils.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/seq2seq_utils.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/simnet_dygraph_model.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/simnet_dygraph_model.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/simnet_dygraph_model_v2.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/simnet_dygraph_model_v2.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_assert.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_assert.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ast_util.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ast_util.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_basic_api_transformation.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_basic_api_transformation.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_bert.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_bert.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_bmn.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_bmn.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_break_continue.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_break_continue.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_build_strategy.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_build_strategy.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_cache_program.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_cache_program.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_cast.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_cast.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_container.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_container.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_convert_call.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_convert_call.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_convert_call_generator.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_convert_call_generator.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_convert_operators.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_convert_operators.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_cycle_gan.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_cycle_gan.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_declarative.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_declarative.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_dict.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_dict.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_drop_path.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_drop_path.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_fetch_feed.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_fetch_feed.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_for_enumerate.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_for_enumerate.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_full_name_usage.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_full_name_usage.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_function_spec.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_function_spec.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_grad.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_grad.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_grid_generator.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_grid_generator.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ifelse.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ifelse.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ifelse_basic.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ifelse_basic.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_isinstance.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_isinstance.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_lac.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_lac.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_lambda.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_lambda.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_layer_hook.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_layer_hook.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_len.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_len.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_list.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_list.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_logging_utils.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_logging_utils.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_logical.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_logical.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_loop.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_loop.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_lstm.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_lstm.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mnist.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mnist.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mnist_amp.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mnist_amp.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mnist_pure_fp16.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mnist_pure_fp16.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mobile_net.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_mobile_net.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_op_attr.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_op_attr.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_param_guard.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_param_guard.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_partial_program.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_partial_program.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_print.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_print.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_program_translator.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_program_translator.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ptb_lm.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ptb_lm.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ptb_lm_v2.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_ptb_lm_v2.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_reinforcement_learning.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_reinforcement_learning.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet_amp.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet_amp.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet_pure_fp16.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet_pure_fp16.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet_v2.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_resnet_v2.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_return.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_return.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_save_inference_model.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_save_inference_model.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_save_load.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_save_load.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_se_resnet.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_se_resnet.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_sentiment.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_sentiment.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_seq2seq.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_seq2seq.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_simnet.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_simnet.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_simnet_v2.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_simnet_v2.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_slice.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_slice.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_spec_names.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_spec_names.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_static_analysis.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_static_analysis.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_tensor_methods.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_tensor_methods.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_tensor_shape.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_tensor_shape.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_transformer.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_transformer.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_tsm.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_tsm.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_typing.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_typing.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_utils.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_utils.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_variable_trans_func.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_variable_trans_func.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_word2vec.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_word2vec.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/test_yolov3.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/test_yolov3.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/transformer_dygraph_model.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/transformer_dygraph_model.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/transformer_util.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/transformer_util.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/tsm_config_utils.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/tsm_config_utils.py
--- a/python/paddle/fluid/tests/unittests/dygraph_to_static/yolov3.py
+++ b/python/paddle/fluid/tests/unittests/dygraph_to_static/yolov3.py
--- a/python/paddle/fluid/tests/unittests/elastic_demo.py
+++ b/python/paddle/fluid/tests/unittests/elastic_demo.py
--- a/python/paddle/fluid/tests/unittests/fake_reader.py
+++ b/python/paddle/fluid/tests/unittests/fake_reader.py
--- a/python/paddle/fluid/tests/unittests/feed_data_reader.py
+++ b/python/paddle/fluid/tests/unittests/feed_data_reader.py
--- a/python/paddle/fluid/tests/unittests/fft/__init__.py
+++ b/python/paddle/fluid/tests/unittests/fft/__init__.py
--- a/python/paddle/fluid/tests/unittests/fft/spectral_op_np.py
+++ b/python/paddle/fluid/tests/unittests/fft/spectral_op_np.py
--- a/python/paddle/fluid/tests/unittests/fft/test_fft.py
+++ b/python/paddle/fluid/tests/unittests/fft/test_fft.py
--- a/python/paddle/fluid/tests/unittests/fft/test_fft_with_static_graph.py
+++ b/python/paddle/fluid/tests/unittests/fft/test_fft_with_static_graph.py
--- a/python/paddle/fluid/tests/unittests/fft/test_spectral_op.py
+++ b/python/paddle/fluid/tests/unittests/fft/test_spectral_op.py
--- a/python/paddle/fluid/tests/unittests/fleet_heter_ps_training.py
+++ b/python/paddle/fluid/tests/unittests/fleet_heter_ps_training.py
--- a/python/paddle/fluid/tests/unittests/fleet_meta_optimizer_base.py
+++ b/python/paddle/fluid/tests/unittests/fleet_meta_optimizer_base.py
--- a/python/paddle/fluid/tests/unittests/gradient_checker.py
+++ b/python/paddle/fluid/tests/unittests/gradient_checker.py
--- a/python/paddle/fluid/tests/unittests/hccl_tools.py
+++ b/python/paddle/fluid/tests/unittests/hccl_tools.py
--- a/python/paddle/fluid/tests/unittests/hdfs_test_utils.py
+++ b/python/paddle/fluid/tests/unittests/hdfs_test_utils.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_communicate_group.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_communicate_group.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_inference_helper.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_inference_helper.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_amp.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_amp.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_clip_grad.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_clip_grad.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_fp16.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_fp16.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_layers.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_layers.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_model.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_model.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_random.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_mp_random.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_alexnet.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_alexnet.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_amp.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_amp.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_clip_grad.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_clip_grad.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_embedding.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_embedding.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_fp16.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_fp16.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_layer.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_layer.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_recompute.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_recompute.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_save_load.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_save_load.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_transformer.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_pp_transformer.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_sharding_model.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_sharding_model.py
--- a/python/paddle/fluid/tests/unittests/hybrid_parallel_shared_weight.py
+++ b/python/paddle/fluid/tests/unittests/hybrid_parallel_shared_weight.py
--- a/python/paddle/fluid/tests/unittests/init_process_group.py
+++ b/python/paddle/fluid/tests/unittests/init_process_group.py
--- a/python/paddle/fluid/tests/unittests/interpreter/test_standalone_controlflow.py
+++ b/python/paddle/fluid/tests/unittests/interpreter/test_standalone_controlflow.py
--- a/python/paddle/fluid/tests/unittests/interpreter/test_standalone_executor.py
+++ b/python/paddle/fluid/tests/unittests/interpreter/test_standalone_executor.py
--- a/python/paddle/fluid/tests/unittests/interpreter/test_standalone_multiply_write.py
+++ b/python/paddle/fluid/tests/unittests/interpreter/test_standalone_multiply_write.py
--- a/python/paddle/fluid/tests/unittests/ipu/op_test_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/op_test_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_activation_x_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_activation_x_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_arg_max_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_arg_max_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_assign_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_assign_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_avg_shard_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_avg_shard_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_batch_norm_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_batch_norm_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_cast_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_cast_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_concat_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_concat_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_conv_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_conv_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_cross_entropy2_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_cross_entropy2_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_cumsum_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_cumsum_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_dropout_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_dropout_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_elemetwise_x_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_elemetwise_x_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_equal_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_equal_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_eval_model_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_eval_model_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_expand_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_expand_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_fill_any_like_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_fill_any_like_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_fill_constant_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_fill_constant_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_flatten_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_flatten_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_fp16_support_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_fp16_support_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_gather_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_gather_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_gelu_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_gelu_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_gradient_clip_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_gradient_clip_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_greater_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_greater_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_groupnorm_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_groupnorm_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_inference_model_io_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_inference_model_io_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_instancenorm_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_instancenorm_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_ipu_shard_api_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_ipu_shard_api_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_ipu_strategy_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_ipu_strategy_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_layernorm_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_layernorm_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_log_softmax_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_log_softmax_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_logical_not_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_logical_not_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_logical_x_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_logical_x_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_lookuptable_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_lookuptable_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_lookuptable_v2_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_lookuptable_v2_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_lr_sheduler_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_lr_sheduler_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_matmul_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_matmul_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_matmul_serilize_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_matmul_serilize_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_matmul_v2_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_matmul_v2_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_mean_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_mean_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_mixed_precision_inference_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_mixed_precision_inference_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_mixed_precision_training_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_mixed_precision_training_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_model_parallel_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_model_parallel_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_model_pipeline_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_model_pipeline_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_mul_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_mul_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_not_equal_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_not_equal_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_one_hot_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_one_hot_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_one_hot_v2_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_one_hot_v2_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_optimizer_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_optimizer_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_pool_avg_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_pool_avg_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_pool_max_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_pool_max_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_pow_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_pow_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_print_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_print_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_reduce_x_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_reduce_x_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_reshape_inplace_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_reshape_inplace_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_reshape_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_reshape_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_save_load_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_save_load_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_scale_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_scale_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_scaled_optimizer_state_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_scaled_optimizer_state_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_set_batch_size_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_set_batch_size_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_slice_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_slice_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_softmax_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_softmax_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_softmax_with_cross_entropy_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_softmax_with_cross_entropy_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_split_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_split_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_squeeze_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_squeeze_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_stack_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_stack_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_sum_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_sum_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_topk_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_topk_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_transpose_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_transpose_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_unsqueeze_op_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_unsqueeze_op_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_varname_inplace_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_varname_inplace_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_weight_decay_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_weight_decay_ipu.py
--- a/python/paddle/fluid/tests/unittests/ipu/test_weight_sharing_ipu.py
+++ b/python/paddle/fluid/tests/unittests/ipu/test_weight_sharing_ipu.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/auto_scan_test.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/auto_scan_test.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/inference_pass_test.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/inference_pass_test.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/program_config.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/program_config.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/quant_dequant_test.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/quant_dequant_test.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_adaptive_pool2d_convert_global_pass_autoscan.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_adaptive_pool2d_convert_global_pass_autoscan.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_act_mkldnn_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_act_mkldnn_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_bias_mkldnn_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_bias_mkldnn_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_bn_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_bn_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_elementwise_add2_act_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_elementwise_add2_act_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_elementwise_add_act_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_elementwise_add_act_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_elementwise_add_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_elementwise_add_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_eltwiseadd_bn_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_eltwiseadd_bn_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_transpose_bn_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_transpose_bn_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_conv_transpose_eltwiseadd_bn_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_conv_transpose_eltwiseadd_bn_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_emb_eltwise_layernorm_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_emb_eltwise_layernorm_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_fc_elementwise_layernorm_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_fc_elementwise_layernorm_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_fc_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_fc_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_fc_gru_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_fc_gru_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_fc_lstm_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_fc_lstm_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_flatten2_matmul_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_flatten2_matmul_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_identity_scale_clean_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_identity_scale_clean_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_layer_norm_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_layer_norm_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_map_matmul_to_mul_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_map_matmul_to_mul_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_map_matmul_v2_to_matmul_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_map_matmul_v2_to_matmul_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_map_matmul_v2_to_mul_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_map_matmul_v2_to_mul_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_matmul_scale_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_matmul_scale_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_matmul_v2_scale_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_matmul_v2_scale_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_batch_norm_act_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_batch_norm_act_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv3d_bias_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv3d_bias_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv3d_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv3d_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_activation_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_activation_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_affine_channel_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_affine_channel_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_bias_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_bias_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_concat_relu_mkldnn_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_concat_relu_mkldnn_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_elementwise_add_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_elementwise_add_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_gelu_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_gelu_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_hard_sigmoid_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_hard_sigmoid_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_hard_swish_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_hard_swish_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_mish_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_mish_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_transpose_bias_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_conv_transpose_bias_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_cpu_bfloat16_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_cpu_bfloat16_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_depthwise_conv_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_depthwise_conv_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_elt_act_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_elt_act_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_elt_act_fuse_pass_new.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_elt_act_fuse_pass_new.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_fc_act_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_fc_act_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_fc_elementwise_add_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_fc_elementwise_add_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_fc_mish_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_fc_mish_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_inplace_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_inplace_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_int8_scale_calculation_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_int8_scale_calculation_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_log_softmax_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_log_softmax_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmul_op_output_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmul_op_output_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmul_transpose_reshape_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmul_transpose_reshape_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmul_v2_transpose_reshape_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmul_v2_transpose_reshape_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmulv2_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_matmulv2_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_mish_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_mish_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_prelu_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_prelu_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_reshape_transpose_matmul_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_reshape_transpose_matmul_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_reshape_transpose_matmul_v2_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_reshape_transpose_matmul_v2_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_scale_matmul_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_scale_matmul_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_shape_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_shape_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_shuffle_channel_detect_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_shuffle_channel_detect_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_shuffle_channel_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_shuffle_channel_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_softplus_activation_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mkldnn_softplus_activation_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mul_gru_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mul_gru_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_mul_lstm_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_mul_lstm_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_repeated_fc_relu_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_repeated_fc_relu_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_reshape2_matmul_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_reshape2_matmul_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_seq_concat_fc_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_seq_concat_fc_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_seqconv_eltadd_relu_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_seqconv_eltadd_relu_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_seqpool_cvm_concat_fuse_pass_py.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_seqpool_cvm_concat_fuse_pass_py.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_shuffle_channel_detect_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_shuffle_channel_detect_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_simplify_with_basic_ops_pass_autoscan.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_simplify_with_basic_ops_pass_autoscan.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_squared_mat_sub_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_squared_mat_sub_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_squeeze2_matmul_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_squeeze2_matmul_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_transpose_flatten_concat_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_transpose_flatten_concat_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_activation_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_activation_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_affine_channel_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_affine_channel_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_anchor_generator_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_anchor_generator_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv3d_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv3d_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv3d_transpose_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv3d_transpose_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv_quant_dequant_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_conv_quant_dequant_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_activation.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_activation.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_affine_channel.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_affine_channel.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_anchor_generator.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_anchor_generator.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_arg_max.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_arg_max.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_batch_norm.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_batch_norm.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_clip.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_clip.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_concat.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_concat.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_conv2d.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_conv2d.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_conv2d_fusion.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_conv2d_fusion.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_conv2d_transpose.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_conv2d_transpose.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_deformable_conv.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_deformable_conv.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_depthwise_conv2d.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_depthwise_conv2d.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_depthwise_conv2d_transpose.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_depthwise_conv2d_transpose.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_dropout.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_dropout.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_elementwise.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_elementwise.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_emb_eltwise_layernorm.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_emb_eltwise_layernorm.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_flatten.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_flatten.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_flatten_contiguous_range.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_flatten_contiguous_range.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_gather.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_gather.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_gather_nd.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_gather_nd.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_gelu.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_gelu.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_group_norm.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_group_norm.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_hard_sigmoid.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_hard_sigmoid.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_hard_swish.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_hard_swish.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_instance_norm.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_instance_norm.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_layer_norm.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_layer_norm.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_leaky_relu.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_leaky_relu.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_matmul.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_matmul.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_mish.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_mish.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_multiclass_nms3.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_multiclass_nms3.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_multihead_matmul.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_multihead_matmul.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_nearest_interp.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_nearest_interp.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_nearest_interp_v2.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_nearest_interp_v2.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_pad.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_pad.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_pool2d.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_pool2d.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_prelu.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_prelu.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_reduce_mean.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_reduce_mean.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_reduce_sum.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_reduce_sum.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_reshape.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_reshape.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_roi_align.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_roi_align.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_roll.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_roll.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_scale.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_scale.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_shuffle_channel.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_shuffle_channel.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_skip_layernorm.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_skip_layernorm.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_slice.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_slice.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_softmax.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_softmax.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_split.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_split.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_stack.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_stack.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_strided_slice.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_strided_slice.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_swish.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_swish.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_tile.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_tile.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_transpose.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_transpose.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_unary.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_unary.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_yolo_box.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_yolo_box.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_yolo_box_head.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_convert_yolo_box_head.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_deformable_conv.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_deformable_conv.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_dynamic_shape.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_dynamic_shape.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_elementwise_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_elementwise_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_fc_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_fc_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_fc_fuse_quant_dequant_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_fc_fuse_quant_dequant_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_flatten2_matmul_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_flatten2_matmul_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_flatten_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_flatten_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_gather_nd_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_gather_nd_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_gather_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_gather_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_group_norm_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_group_norm_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_inspector.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_inspector.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_instance_norm_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_instance_norm_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_matmul.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_matmul.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_matmul_quant_dequant.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_matmul_quant_dequant.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_multiclass_nms3_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_multiclass_nms3_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_multiclass_nms_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_multiclass_nms_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_nearest_interp_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_nearest_interp_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_nearest_interp_v2_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_nearest_interp_v2_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_pad_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_pad_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_pool3d_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_pool3d_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_pool_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_pool_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reduce_mean_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reduce_mean_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reduce_sum_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reduce_sum_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reshape2_matmul_fuse_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reshape2_matmul_fuse_pass.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reshape_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_reshape_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_roi_align_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_roi_align_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_scale_op.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_scale_op.py
--- a/python/paddle/fluid/tests/unittests/ir/inference/test_trt_shuffle_channel_detect_pass.py
+++ b/python/paddle/fluid/tests/unittests/ir/inference/test_trt_shuffle_channel_detect_pass.py