[CodeStyle][black] use black instead of yapf (#46014)

* update config * re-blacken python code * temporarily disable date and diff_py_file * skip a format

[CodeStyle][black] use black instead of yapf (#46014)
* update config * re-blacken python code * temporarily disable date and diff_py_file * skip a format
7097630f · Nyakku Shigure · GitHub · 016766cc · 7097630f · 7097630f
1000 changed file
--- a/.cmake-format.py
+++ b/.cmake-format.py
@@ -109,5 +109,5 @@ with section("parse"):
                "SRCS": '*',
                "DEPS": '*',
            }
-        }
+        },
    }
--- a/.pre-commit-config.yaml
+++ b/.pre-commit-config.yaml
@@ -28,11 +28,17 @@ repos:
                python/paddle/fluid/tests/unittests/collective/fleet/test_hdfs1.py|
                python/paddle/fluid/tests/unittests/dygraph_to_static/test_error.py
            )$
-   repo: https://github.com/google/yapf
+-   repo: https://github.com/psf/black.git
-    rev: v0.32.0
+    rev: 22.8.0
    hooks:
-    -   id: yapf
+    -   id: black
-        files: (.*\.(py|bzl)|BUILD|.*\.BUILD|WORKSPACE)$
+        files: (.*\.(py|pyi|bzl)|BUILD|.*\.BUILD|WORKSPACE)$
+        # Temporary exclude, will be formatted in a separate PR
+        exclude: |
+            (?x)^(
+                python/paddle/fluid/tests/unittests/dygraph_to_static/test_error.py|
+                python/paddle/fluid/tests/unittests/dygraph_to_static/test_origin_info.py
+            )$
 -   repo: https://github.com/PyCQA/flake8
    rev: 4.0.1
    hooks:

--- a/.style.yapf
+++ b/.style.yapf
-[style]
-based_on_style = pep8
-column_limit = 80
--- a/cmake/copyfile.py
+++ b/cmake/copyfile.py
@@ -21,7 +21,7 @@ import glob
 def main():
    src = sys.argv[1]
    dst = sys.argv[2]
-    if os.path.isdir(src):  #copy directory
+    if os.path.isdir(src):  # copy directory
        pathList = os.path.split(src)
        dst = os.path.join(dst, pathList[-1])
        if not os.path.exists(dst):
@@ -31,7 +31,7 @@ def main():
            shutil.rmtree(dst)
            shutil.copytree(src, dst)
            print("overwritten copy directory: {0} --->>> {1}".format(src, dst))
-    else:  #copy file, wildcard
+    else:  # copy file, wildcard
        if not os.path.exists(dst):
            os.makedirs(dst)
        srcFiles = glob.glob(src)

--- a/cmake/make_resource.py
+++ b/cmake/make_resource.py
@@ -20,7 +20,15 @@ res = sys.argv[1]
 out = sys.argv[2]
 var = re.sub(r'[ .-]', '_', os.path.basename(res))
-open(out, "w").write("const unsigned char " + var + "[] = {" +
+open(out, "w").write(
-                     ",".join(["0x%02x" % ord(c)
+    "const unsigned char "
-                               for c in open(res).read()]) + ",0};\n" +
+    + var
-                     "const unsigned " + var + "_size = sizeof(" + var + ");\n")
+    + "[] = {"
+    + ",".join(["0x%02x" % ord(c) for c in open(res).read()])
+    + ",0};\n"
+    + "const unsigned "
+    + var
+    + "_size = sizeof("
+    + var
+    + ");\n"
+)
--- a/paddle/fluid/eager/auto_code_generator/generate_file_structures.py
+++ b/paddle/fluid/eager/auto_code_generator/generate_file_structures.py
@@ -41,8 +41,9 @@ def GenerateFileStructureForFinalDygraph(eager_dir):
            os.mkdir(directory)
    # Empty files
-    dygraph_forward_api_h_path = os.path.join(generated_dir,
+    dygraph_forward_api_h_path = os.path.join(
-                                              "dygraph_functions.h")
+        generated_dir, "dygraph_functions.h"
+    )
    empty_files = [dygraph_forward_api_h_path]
    empty_files.append(os.path.join(forwards_dir, "dygraph_functions.cc"))
    empty_files.append(os.path.join(nodes_dir, "nodes.cc"))
@@ -83,32 +84,41 @@ def GenerateFileStructureForIntermediateDygraph(eager_dir, split_count):
            os.mkdir(directory)
    # Empty files
-    dygraph_forward_api_h_path = os.path.join(generated_dir,
+    dygraph_forward_api_h_path = os.path.join(
-                                              "dygraph_forward_api.h")
+        generated_dir, "dygraph_forward_api.h"
+    )
    empty_files = [dygraph_forward_api_h_path]
    empty_files.append(os.path.join(nodes_dir, "nodes.h"))
    for i in range(split_count):
        empty_files.append(
-            os.path.join(forwards_dir,
+            os.path.join(
-                         "dygraph_forward_functions" + str(i + 1) + ".cc"))
+                forwards_dir, "dygraph_forward_functions" + str(i + 1) + ".cc"
-        empty_files.append(os.path.join(nodes_dir,
+            )
-                                        "nodes" + str(i + 1) + ".cc"))
+        )
+        empty_files.append(
+            os.path.join(nodes_dir, "nodes" + str(i + 1) + ".cc")
+        )
    empty_files.append(
-        os.path.join(forwards_dir, "dygraph_forward_functions_args_info.cc"))
+        os.path.join(forwards_dir, "dygraph_forward_functions_args_info.cc")
+    )
    empty_files.append(
-        os.path.join(forwards_dir,
+        os.path.join(
-                     "dygraph_forward_functions_args_type_info.cc"))
+            forwards_dir, "dygraph_forward_functions_args_type_info.cc"
+        )
+    )
    empty_files.append(
-        os.path.join(forwards_dir, "dygraph_forward_functions_returns_info.cc"))
+        os.path.join(forwards_dir, "dygraph_forward_functions_returns_info.cc")
+    )
    for path in empty_files:
        if not os.path.exists(path):
            open(path, 'a').close()
    # CMakeLists
    nodes_level_cmakelist_path = os.path.join(nodes_dir, "CMakeLists.txt")
-    generated_level_cmakelist_path = os.path.join(generated_dir,
+    generated_level_cmakelist_path = os.path.join(
-                                                  "CMakeLists.txt")
+        generated_dir, "CMakeLists.txt"
+    )
    forwards_level_cmakelist_path = os.path.join(forwards_dir, "CMakeLists.txt")
    with open(nodes_level_cmakelist_path, "w") as f:
@@ -120,9 +130,11 @@ def GenerateFileStructureForIntermediateDygraph(eager_dir, split_count):
        for i in range(split_count):
            f.write(
                "  COMMAND ${CMAKE_COMMAND} -E copy_if_different \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/nodes/nodes"
-                + str(i + 1) +
+                + str(i + 1)
-                ".tmp.cc\" \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/nodes/nodes"
+                + ".tmp.cc\" \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/nodes/nodes"
-                + str(i + 1) + ".cc\"\n")
+                + str(i + 1)
+                + ".cc\"\n"
+            )
        f.write("  DEPENDS legacy_eager_codegen\n")
        f.write("  VERBATIM)\n")
@@ -142,9 +154,11 @@ def GenerateFileStructureForIntermediateDygraph(eager_dir, split_count):
        for i in range(split_count):
            f.write(
                "  COMMAND ${CMAKE_COMMAND} -E copy_if_different \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/forwards/dygraph_forward_functions"
-                + str(i + 1) +
+                + str(i + 1)
-                ".tmp.cc\" \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/forwards/dygraph_forward_functions"
+                + ".tmp.cc\" \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/forwards/dygraph_forward_functions"
-                + str(i + 1) + ".cc\"\n")
+                + str(i + 1)
+                + ".cc\"\n"
+            )
        f.write(
            "  COMMAND ${CMAKE_COMMAND} -E copy_if_different \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/forwards/dygraph_forward_functions_args_info.tmp.cc\" \"${PADDLE_SOURCE_DIR}/paddle/fluid/eager/api/generated/fluid_generated/forwards/dygraph_forward_functions_args_info.cc\"\n"
        )
@@ -167,7 +181,8 @@ def GenerateFileStructureForIntermediateDygraph(eager_dir, split_count):
            "${fluid_manual_functions} DEPS ${eager_deps} ${fluid_deps} ${GLOB_OP_LIB} ${GLOB_OPERATOR_DEPS})\n"
        )
        f.write(
-            "add_dependencies(dygraph_function copy_dygraph_forward_functions)")
+            "add_dependencies(dygraph_function copy_dygraph_forward_functions)"
+        )
    with open(generated_level_cmakelist_path, "w") as f:
        f.write("add_subdirectory(forwards)\nadd_subdirectory(nodes)")

--- a/paddle/fluid/eager/auto_code_generator/generator/codegen_utils.py
+++ b/paddle/fluid/eager/auto_code_generator/generator/codegen_utils.py
@@ -18,20 +18,45 @@ import re
 ########################
 ### Global Variables ###
 ########################
-ops_to_fill_zero_for_empty_grads = set([
+ops_to_fill_zero_for_empty_grads = set(
-    "split_grad", "split_with_num_grad", "rnn_grad", "matmul_double_grad",
+    [
-    "matmul_triple_grad", "sigmoid_double_grad", "sigmoid_triple_grad",
+        "split_grad",
-    "add_double_grad", "add_triple_grad", "multiply_grad",
+        "split_with_num_grad",
-    "multiply_double_grad", "multiply_triple_grad", "conv2d_grad_grad",
+        "rnn_grad",
-    "batch_norm_double_grad", "tanh_double_grad", "tanh_triple_grad",
+        "matmul_double_grad",
-    "subtract_double_grad", "divide_double_grad", "log_double_grad",
+        "matmul_triple_grad",
-    "elu_double_grad", "leaky_relu_double_grad", "sqrt_double_grad",
+        "sigmoid_double_grad",
-    "rsqrt_double_grad", "square_double_grad", "celu_double_grad",
+        "sigmoid_triple_grad",
-    "pad_double_grad", "pad3d_double_grad", "squeeze_double_grad",
+        "add_double_grad",
-    "unsqueeze_double_grad", "instance_norm_double_grad", "conv3d_double_grad",
+        "add_triple_grad",
-    "depthwise_conv2d_grad_grad", "concat_double_grad", "expand_grad",
+        "multiply_grad",
-    "argsort_grad"
+        "multiply_double_grad",
-])
+        "multiply_triple_grad",
+        "conv2d_grad_grad",
+        "batch_norm_double_grad",
+        "tanh_double_grad",
+        "tanh_triple_grad",
+        "subtract_double_grad",
+        "divide_double_grad",
+        "log_double_grad",
+        "elu_double_grad",
+        "leaky_relu_double_grad",
+        "sqrt_double_grad",
+        "rsqrt_double_grad",
+        "square_double_grad",
+        "celu_double_grad",
+        "pad_double_grad",
+        "pad3d_double_grad",
+        "squeeze_double_grad",
+        "unsqueeze_double_grad",
+        "instance_norm_double_grad",
+        "conv3d_double_grad",
+        "depthwise_conv2d_grad_grad",
+        "concat_double_grad",
+        "expand_grad",
+        "argsort_grad",
+    ]
+)
 # For API dispatch used at python-level
 # { op_name : [arg_name, ...] }
@@ -40,22 +65,31 @@ core_ops_args_info = {}
 core_ops_args_type_info = {}
 yaml_types_mapping = {
-    'int' : 'int', 'int32_t' : 'int32_t', 'int64_t' : 'int64_t',  'size_t' : 'size_t', \
+    'int': 'int',
-    'float' : 'float', 'double' : 'double', 'bool' : 'bool', \
+    'int32_t': 'int32_t',
-    'str' : 'std::string', \
+    'int64_t': 'int64_t',
-    'str[]' : 'std::vector<std::string>', 'float[]' : 'std::vector<float>', \
+    'size_t': 'size_t',
-    'Place' : 'paddle::Place', 'DataLayout' : 'phi::DataLayout', 'DataType' : 'paddle::experimental::DataType', \
+    'float': 'float',
-    'int64_t[]' : 'std::vector<int64_t>', 'int[]' : 'std::vector<int>',
+    'double': 'double',
-    'Tensor' : 'Tensor',
+    'bool': 'bool',
-    'Tensor[]' : 'std::vector<Tensor>',
+    'str': 'std::string',
-    'Tensor[Tensor[]]' : 'std::vector<std::vector<Tensor>>',
+    'str[]': 'std::vector<std::string>',
-    'Scalar' : 'paddle::experimental::Scalar',
+    'float[]': 'std::vector<float>',
-    'Scalar(int)' : 'paddle::experimental::Scalar',
+    'Place': 'paddle::Place',
-    'Scalar(int64_t)' : 'paddle::experimental::Scalar',
+    'DataLayout': 'phi::DataLayout',
-    'Scalar(float)' : 'paddle::experimental::Scalar',
+    'DataType': 'paddle::experimental::DataType',
-    'Scalar(double)' : 'paddle::experimental::Scalar',
+    'int64_t[]': 'std::vector<int64_t>',
-    'Scalar[]' : 'std::vector<phi::Scalar>',
+    'int[]': 'std::vector<int>',
-    'IntArray' : 'paddle::experimental::IntArray'
+    'Tensor': 'Tensor',
+    'Tensor[]': 'std::vector<Tensor>',
+    'Tensor[Tensor[]]': 'std::vector<std::vector<Tensor>>',
+    'Scalar': 'paddle::experimental::Scalar',
+    'Scalar(int)': 'paddle::experimental::Scalar',
+    'Scalar(int64_t)': 'paddle::experimental::Scalar',
+    'Scalar(float)': 'paddle::experimental::Scalar',
+    'Scalar(double)': 'paddle::experimental::Scalar',
+    'Scalar[]': 'std::vector<phi::Scalar>',
+    'IntArray': 'paddle::experimental::IntArray',
 }
@@ -81,7 +115,8 @@ def ReadBwdFile(filepath):
    if contents is not None:
        for content in contents:
            assert 'backward_op' in content.keys(), AssertMessage(
-                'backward_op', content.keys())
+                'backward_op', content.keys()
+            )
            if 'backward_op' in content.keys():
                api_name = content['backward_op']
@@ -116,7 +151,8 @@ def IsPlainTensorType(string):
 def IsVectorTensorType(string):
    vector_tensor_types = [
-        'std::vector<std::vector<Tensor>>', 'std::vector<Tensor>'
+        'std::vector<std::vector<Tensor>>',
+        'std::vector<Tensor>',
    ]
    if string in vector_tensor_types:
        return True
@@ -147,7 +183,6 @@ def RemoveConstAndReference(string):
 def GetGradNodeName(string):
    def str2Hump(text):
        arr = filter(None, text.split('_'))
        res = ''
@@ -166,7 +201,6 @@ def GetDygraphForwardFunctionName(string):
 def GetDygraphLogName(string):
    def str2Hump(text):
        arr = filter(None, text.split('_'))
        res = ''
@@ -236,10 +270,14 @@ def ParseYamlArgs(string):
        m = re.search(pattern, arg)
        arg_type = m.group(1).strip()
        arg_name = m.group(3).split("=")[0].strip()
-        default_value = m.group(3).split("=")[1].strip() if len(
+        default_value = (
-            m.group(3).split("=")) > 1 else None
+            m.group(3).split("=")[1].strip()
+            if len(m.group(3).split("=")) > 1
-        assert arg_type in yaml_types_mapping.keys(
+            else None
+        )
+        assert (
+            arg_type in yaml_types_mapping.keys()
        ), f"The argument type {arg_type} in yaml config is not supported in yaml_types_mapping."
        if arg_type in ["DataType", "DataLayout"] and default_value is not None:
            default_value = f"paddle::experimental::{default_value}"
@@ -277,7 +315,8 @@ def ParseYamlReturns(string):
        else:
            ret_type = ret.strip()
-        assert ret_type in yaml_types_mapping.keys(
+        assert (
+            ret_type in yaml_types_mapping.keys()
        ), f"The return type {ret_type} in yaml config is not supported in yaml_types_mapping."
        ret_type = yaml_types_mapping[ret_type]
@@ -295,7 +334,9 @@ def ParseYamlForwardFromBackward(string):
    wspace = r'\s*'
    fargs = r'(.*?)'
    frets = r'(.*)'
-    pattern = fr'{fname}{wspace}\({wspace}{fargs}{wspace}\){wspace}->{wspace}{frets}'
+    pattern = (
+        fr'{fname}{wspace}\({wspace}{fargs}{wspace}\){wspace}->{wspace}{frets}'
+    )
    m = re.search(pattern, string)
    function_name = m.group(1)
@@ -359,38 +400,44 @@ def ParseYamlInplaceInfo(string):
 ###  Generator Base  ###
 ########################
 class FunctionGeneratorBase:
    def __init__(self, forward_api_contents, namespace):
        self.forward_api_contents = forward_api_contents
        self.namespace = namespace
-        self.is_forward_only = False if 'backward' in forward_api_contents.keys(
+        self.is_forward_only = (
-        ) else True
+            False if 'backward' in forward_api_contents.keys() else True
+        )
        self.forward_api_name = ""
-        self.orig_forward_inputs_list = [
+        self.orig_forward_inputs_list = (
-        ]  #[ [arg_name, arg_type, orig_position], ...]
+            []
-        self.orig_forward_attrs_list = [
+        )  # [ [arg_name, arg_type, orig_position], ...]
-        ]  #[ [attr_name, attr_type, default_value, orig_position], ...]
+        self.orig_forward_attrs_list = (
-        self.orig_forward_returns_list = [
+            []
-        ]  #[ [ret_name, ret_type, orig_position], ...]
+        )  # [ [attr_name, attr_type, default_value, orig_position], ...]
+        self.orig_forward_returns_list = (
+            []
+        )  # [ [ret_name, ret_type, orig_position], ...]
        # Processed Forward Data
-        self.forward_inputs_position_map = {
+        self.forward_inputs_position_map = (
-        }  #{ "name" : [type, fwd_position] }
+            {}
-        self.forward_outputs_position_map = {
+        )  # { "name" : [type, fwd_position] }
-        }  #{ "name" : [type, fwd_position] }
+        self.forward_outputs_position_map = (
+            {}
+        )  # { "name" : [type, fwd_position] }
        # Special Op Attributes
-        self.optional_inputs = []  #[name, ...]
+        self.optional_inputs = []  # [name, ...]
-        self.no_need_buffers = []  #[name, ...]
+        self.no_need_buffers = []  # [name, ...]
-        self.intermediate_outputs = []  #[name, ...]
+        self.intermediate_outputs = []  # [name, ...]
-        self.forward_inplace_map = {}  #{name : name, ...}
+        self.forward_inplace_map = {}  # {name : name, ...}
    def ParseForwardInplaceInfo(self):
        forward_api_contents = self.forward_api_contents
-        if 'inplace' not in forward_api_contents.keys(): return
+        if 'inplace' not in forward_api_contents.keys():
+            return
        inplace_map_str = forward_api_contents['inplace']
        self.forward_inplace_map = ParseYamlInplaceInfo(inplace_map_str)
@@ -432,19 +479,26 @@ class FunctionGeneratorBase:
        forward_args_str = forward_api_contents['args']
        forward_returns_str = forward_api_contents['output']
-        assert 'op' in forward_api_contents.keys(
+        assert (
+            'op' in forward_api_contents.keys()
        ), "Unable to find \"op\" in forward_api_contents keys"
-        assert 'args' in forward_api_contents.keys(
+        assert (
+            'args' in forward_api_contents.keys()
        ), "Unable to find \"args\" in forward_api_contents keys"
-        assert 'output' in forward_api_contents.keys(
+        assert (
+            'output' in forward_api_contents.keys()
        ), "Unable to find \"output\" in forward_api_contents keys"
        # Collect Original Forward Inputs/Outputs and then perform validation checks
-        self.orig_forward_inputs_list, self.orig_forward_attrs_list, self.orig_forward_returns_list = ParseYamlForward(
+        (
-            forward_args_str, forward_returns_str)
+            self.orig_forward_inputs_list,
+            self.orig_forward_attrs_list,
-    def DetermineForwardPositionMap(self, forward_inputs_list,
+            self.orig_forward_returns_list,
-                                    forward_returns_list):
+        ) = ParseYamlForward(forward_args_str, forward_returns_str)
+    def DetermineForwardPositionMap(
+        self, forward_inputs_list, forward_returns_list
+    ):
        for i in range(len(forward_inputs_list)):
            forward_input = forward_inputs_list[i]
            input_name = forward_input[0]
@@ -452,13 +506,14 @@ class FunctionGeneratorBase:
            input_pos = forward_input[2]
            self.forward_inputs_position_map[input_name] = [
-                input_type, input_pos
+                input_type,
+                input_pos,
            ]
        for i in range(len(forward_returns_list)):
            forward_return = forward_returns_list[i]
            if len(forward_return[0]) == 0:
-                if (len(forward_returns_list) == 1):
+                if len(forward_returns_list) == 1:
                    return_name = "out"
                else:
                    return_name = "out_{}".format(i + 1)
@@ -468,12 +523,12 @@ class FunctionGeneratorBase:
            return_pos = forward_return[2]
            self.forward_outputs_position_map[return_name] = [
-                return_type, return_pos
+                return_type,
+                return_pos,
            ]
 class GeneratorBase:
    def __init__(self, api_yaml_path):
        self.namespace = ""
        self.api_yaml_path = api_yaml_path

--- a/paddle/fluid/eager/auto_code_generator/generator/eager_gen.py
+++ b/paddle/fluid/eager/auto_code_generator/generator/eager_gen.py
--- a/paddle/fluid/eager/auto_code_generator/generator/python_c_gen.py
+++ b/paddle/fluid/eager/auto_code_generator/generator/python_c_gen.py
--- a/paddle/fluid/inference/tests/api/full_ILSVRC2012_val_preprocess.py
+++ b/paddle/fluid/inference/tests/api/full_ILSVRC2012_val_preprocess.py
@@ -94,8 +94,9 @@ def download_concat(cache_folder, zip_path):
 def print_processbar(done_percentage):
    done_filled = done_percentage * '='
    empty_filled = (100 - done_percentage) * ' '
-    sys.stdout.write("\r[%s%s]%d%%" %
+    sys.stdout.write(
-                     (done_filled, empty_filled, done_percentage))
+        "\r[%s%s]%d%%" % (done_filled, empty_filled, done_percentage)
+    )
    sys.stdout.flush()
@@ -137,7 +138,7 @@ def convert_Imagenet_tar2bin(tar_file, output_file):
            val_dict[name] = label
        for img_name in dataset.keys():
-            remove_len = (len(FOLDER_NAME))
+            remove_len = len(FOLDER_NAME)
            img_name_prim = img_name[remove_len:]
            label = val_dict[img_name_prim]
            label_int = (int)(label)
@@ -156,19 +157,25 @@ def run_convert():
    retry = 0
    try_limit = 3
-    while not (os.path.exists(output_file)
+    while not (
-               and os.path.getsize(output_file) == FULL_SIZE_BYTES):
+        os.path.exists(output_file)
+        and os.path.getsize(output_file) == FULL_SIZE_BYTES
+    ):
        if os.path.exists(output_file):
            sys.stderr.write(
-                "\n\nThe existing binary file[{}] is broken. Start to generate new one...\n\n"
+                "\n\nThe existing binary file[{}] is broken. Start to generate new one...\n\n".format(
-                .format(output_file))
+                    output_file
+                )
+            )
            os.remove(output_file)
        if retry < try_limit:
            retry = retry + 1
        else:
            raise RuntimeError(
-                "Can not convert the dataset to binary file with try limit {0}".
+                "Can not convert the dataset to binary file with try limit {0}".format(
-                format(try_limit))
+                    try_limit
+                )
+            )
        download_concat(cache_folder, zip_path)
        convert_Imagenet_tar2bin(zip_path, output_file)
    print("\nSuccess! The binary file can be found at {0}".format(output_file))
@@ -193,63 +200,75 @@ def convert_Imagenet_local2bin(args):
                if not os.path.exists(img_path):
                    continue
-                #save image(float32) to file
+                # save image(float32) to file
                img = Image.open(img_path)
                img = process_image(img)
                np_img = np.array(img)
-                of.seek(SIZE_INT64 +
+                of.seek(
-                        SIZE_FLOAT32 * DATA_DIM * DATA_DIM * 3 * idx)
+                    SIZE_INT64 + SIZE_FLOAT32 * DATA_DIM * DATA_DIM * 3 * idx
+                )
                of.write(np_img.astype('float32').tobytes())
-                #save label(int64_t) to file
+                # save label(int64_t) to file
                label_int = (int)(label)
                np_label = np.array(label_int)
-                of.seek(SIZE_INT64 +
+                of.seek(
-                        SIZE_FLOAT32 * DATA_DIM * DATA_DIM * 3 * num_images +
+                    SIZE_INT64
-                        idx * SIZE_INT64)
+                    + SIZE_FLOAT32 * DATA_DIM * DATA_DIM * 3 * num_images
+                    + idx * SIZE_INT64
+                )
                of.write(np_label.astype('int64').tobytes())
        # The bin file should contain
        # number of images + all images data + all corresponding labels
        # so the file target_size should be as follows
-        target_size = SIZE_INT64 + num_images * 3 * args.data_dim * args.data_dim * SIZE_FLOAT32 + num_images * SIZE_INT64
+        target_size = (
-        if (os.path.getsize(bin_file_path) == target_size):
+            SIZE_INT64
+            + num_images * 3 * args.data_dim * args.data_dim * SIZE_FLOAT32
+            + num_images * SIZE_INT64
+        )
+        if os.path.getsize(bin_file_path) == target_size:
            print(
-                "Success! The user data output binary file can be found at: {0}"
+                "Success! The user data output binary file can be found at: {0}".format(
-                .format(bin_file_path))
+                    bin_file_path
+                )
+            )
        else:
            print("Conversion failed!")
 def main_preprocess_Imagenet(args):
    parser = argparse.ArgumentParser(
-        description=
+        description="Convert the full Imagenet val set or local data to binary file.",
-        "Convert the full Imagenet val set or local data to binary file.",
        usage=None,
-        add_help=True)
+        add_help=True,
+    )
    parser.add_argument(
        '--local',
        action="store_true",
-        help="If used, user need to set --data_dir and then convert file")
+        help="If used, user need to set --data_dir and then convert file",
-    parser.add_argument("--data_dir",
+    )
-                        default="",
+    parser.add_argument(
-                        type=str,
+        "--data_dir", default="", type=str, help="Dataset root directory"
-                        help="Dataset root directory")
+    )
    parser.add_argument(
        "--label_list",
        type=str,
        default="val_list.txt",
-        help=
+        help="List of object labels with same sequence as denoted in the annotation file",
-        "List of object labels with same sequence as denoted in the annotation file"
+    )
+    parser.add_argument(
+        "--output_file",
+        type=str,
+        default="imagenet_small.bin",
+        help="File path of the output binary file",
+    )
+    parser.add_argument(
+        "--data_dim",
+        type=int,
+        default=DATA_DIM,
+        help="Image preprocess with data_dim width and height",
    )
-    parser.add_argument("--output_file",
-                        type=str,
-                        default="imagenet_small.bin",
-                        help="File path of the output binary file")
-    parser.add_argument("--data_dim",
-                        type=int,
-                        default=DATA_DIM,
-                        help="Image preprocess with data_dim width and height")
    args = parser.parse_args()
    if args.local:

--- a/paddle/fluid/inference/tests/api/full_pascalvoc_test_preprocess.py
+++ b/paddle/fluid/inference/tests/api/full_pascalvoc_test_preprocess.py
@@ -24,7 +24,9 @@ import hashlib
 import tarfile
 import argparse
-DATA_URL = "http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar"
+DATA_URL = (
+    "http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar"
+)
 DATA_DIR = os.path.expanduser("~/.cache/paddle/dataset/pascalvoc/")
 TAR_FILE = "VOCtest_06-Nov-2007.tar"
 TAR_PATH = os.path.join(DATA_DIR, TAR_FILE)
@@ -106,8 +108,9 @@ def convert_pascalvoc_local2bin(args):
        for object in objects:
            bbox_sample = []
            # start from 1
-            bbox_sample.append(float(label_list.index(
+            bbox_sample.append(
-                object.find('name').text)))
+                float(label_list.index(object.find('name').text))
+            )
            bbox = object.find('bndbox')
            difficult = float(object.find('difficult').text)
            bbox_sample.append(float(bbox.find('xmin').text) / im_width)
@@ -118,7 +121,8 @@ def convert_pascalvoc_local2bin(args):
            bbox_labels.append(bbox_sample)
        bbox_labels = np.array(bbox_labels)
-        if len(bbox_labels) == 0: continue
+        if len(bbox_labels) == 0:
+            continue
        lbls.extend(bbox_labels[:, 0])
        boxes.extend(bbox_labels[:, 1:5])
@@ -135,11 +139,17 @@ def convert_pascalvoc_local2bin(args):
    # number of images + all images data + an array that represent object numbers of each image
    # + labels of all objects in images + bboxes of all objects + difficulties of all objects
    # so the target size should be as follows:
-    target_size = SIZE_INT64 + image_nums * 3 * args.resize_h * args.resize_h * SIZE_FLOAT32 + image_nums * SIZE_INT64 + object_nums_sum * (
+    target_size = (
-        SIZE_INT64 + 4 * SIZE_FLOAT32 + SIZE_INT64)
+        SIZE_INT64
-    if (os.path.getsize(output_file_path) == target_size):
+        + image_nums * 3 * args.resize_h * args.resize_h * SIZE_FLOAT32
-        print("Success! \nThe local data output binary file can be found at: ",
+        + image_nums * SIZE_INT64
-              output_file_path)
+        + object_nums_sum * (SIZE_INT64 + 4 * SIZE_FLOAT32 + SIZE_INT64)
+    )
+    if os.path.getsize(output_file_path) == target_size:
+        print(
+            "Success! \nThe local data output binary file can be found at: ",
+            output_file_path,
+        )
    else:
        print("Conversion failed!")
@@ -147,8 +157,9 @@ def convert_pascalvoc_local2bin(args):
 def print_processbar(done_percentage):
    done_filled = done_percentage * '='
    empty_filled = (100 - done_percentage) * ' '
-    sys.stdout.write("\r[%s%s]%d%%" %
+    sys.stdout.write(
-                     (done_filled, empty_filled, done_percentage))
+        "\r[%s%s]%d%%" % (done_filled, empty_filled, done_percentage)
+    )
    sys.stdout.flush()
@@ -163,13 +174,30 @@ def convert_pascalvoc_tar2bin(tar_path, data_out_path):
    # map label to number (index)
    label_list = [
-        "background", "aeroplane", "bicycle", "bird", "boat", "bottle", "bus",
+        "background",
-        "car", "cat", "chair", "cow", "diningtable", "dog", "horse",
+        "aeroplane",
-        "motorbike", "person", "pottedplant", "sheep", "sofa", "train",
+        "bicycle",
-        "tvmonitor"
+        "bird",
+        "boat",
+        "bottle",
+        "bus",
+        "car",
+        "cat",
+        "chair",
+        "cow",
+        "diningtable",
+        "dog",
+        "horse",
+        "motorbike",
+        "person",
+        "pottedplant",
+        "sheep",
+        "sofa",
+        "train",
+        "tvmonitor",
    ]
    print_processbar(0)
-    #read from tar file and write to bin
+    # read from tar file and write to bin
    tar = tarfile.open(tar_path, "r")
    f_test = tar.extractfile(TEST_LIST_KEY).read()
    lines = f_test.split('\n')
@@ -210,8 +238,9 @@ def convert_pascalvoc_tar2bin(tar_path, data_out_path):
        for object in objects:
            bbox_sample = []
-            bbox_sample.append(float(label_list.index(
+            bbox_sample.append(
-                object.find('name').text)))
+                float(label_list.index(object.find('name').text))
+            )
            bbox = object.find('bndbox')
            difficult = float(object.find('difficult').text)
            bbox_sample.append(float(bbox.find('xmin').text) / im_width)
@@ -222,7 +251,8 @@ def convert_pascalvoc_tar2bin(tar_path, data_out_path):
            bbox_labels.append(bbox_sample)
        bbox_labels = np.array(bbox_labels)
-        if len(bbox_labels) == 0: continue
+        if len(bbox_labels) == 0:
+            continue
        lbls.extend(bbox_labels[:, 0])
        boxes.extend(bbox_labels[:, 1:5])
        difficults.extend(bbox_labels[:, -1])
@@ -258,12 +288,16 @@ def download_pascalvoc(data_url, data_dir, tar_targethash, tar_path):
 def run_convert():
    try_limit = 2
    retry = 0
-    while not (os.path.exists(DATA_OUT_PATH) and os.path.getsize(DATA_OUT_PATH)
+    while not (
-               == BIN_FULLSIZE and BIN_TARGETHASH == hashlib.md5(
+        os.path.exists(DATA_OUT_PATH)
-                   open(DATA_OUT_PATH, 'rb').read()).hexdigest()):
+        and os.path.getsize(DATA_OUT_PATH) == BIN_FULLSIZE
+        and BIN_TARGETHASH
+        == hashlib.md5(open(DATA_OUT_PATH, 'rb').read()).hexdigest()
+    ):
        if os.path.exists(DATA_OUT_PATH):
            sys.stderr.write(
-                "The existing binary file is broken. It is being removed...\n")
+                "The existing binary file is broken. It is being removed...\n"
+            )
            os.remove(DATA_OUT_PATH)
        if retry < try_limit:
            retry = retry + 1
@@ -275,52 +309,60 @@ def run_convert():
 def main_pascalvoc_preprocess(args):
    parser = argparse.ArgumentParser(
-        description=
+        description="Convert the full pascalvoc val set or local data to binary file.",
-        "Convert the full pascalvoc val set or local data to binary file.",
        usage=None,
-        add_help=True)
+        add_help=True,
+    )
    parser.add_argument(
        '--local',
        action="store_true",
-        help="If used, user need to set --data_dir and then convert file")
+        help="If used, user need to set --data_dir and then convert file",
-    parser.add_argument("--data_dir",
+    )
-                        default="",
+    parser.add_argument(
-                        type=str,
+        "--data_dir", default="", type=str, help="Dataset root directory"
-                        help="Dataset root directory")
+    )
    parser.add_argument(
        "--img_annotation_list",
        type=str,
        default="test_100.txt",
-        help=
+        help="A file containing the image file path and corresponding annotation file path",
-        "A file containing the image file path and corresponding annotation file path"
    )
    parser.add_argument(
        "--label_file",
        type=str,
        default="label_list",
-        help=
+        help="List of object labels with same sequence as denoted in the annotation file",
-        "List of object labels with same sequence as denoted in the annotation file"
+    )
+    parser.add_argument(
+        "--output_file",
+        type=str,
+        default="pascalvoc_small.bin",
+        help="File path of the output binary file",
+    )
+    parser.add_argument(
+        "--resize_h",
+        type=int,
+        default=RESIZE_H,
+        help="Image preprocess with resize_h",
+    )
+    parser.add_argument(
+        "--resize_w",
+        type=int,
+        default=RESIZE_W,
+        help="Image prerocess with resize_w",
+    )
+    parser.add_argument(
+        "--mean_value",
+        type=str,
+        default=MEAN_VALUE,
+        help="Image preprocess with mean_value",
+    )
+    parser.add_argument(
+        "--ap_version",
+        type=str,
+        default=AP_VERSION,
+        help="Image preprocess with ap_version",
    )
-    parser.add_argument("--output_file",
-                        type=str,
-                        default="pascalvoc_small.bin",
-                        help="File path of the output binary file")
-    parser.add_argument("--resize_h",
-                        type=int,
-                        default=RESIZE_H,
-                        help="Image preprocess with resize_h")
-    parser.add_argument("--resize_w",
-                        type=int,
-                        default=RESIZE_W,
-                        help="Image prerocess with resize_w")
-    parser.add_argument("--mean_value",
-                        type=str,
-                        default=MEAN_VALUE,
-                        help="Image preprocess with mean_value")
-    parser.add_argument("--ap_version",
-                        type=str,
-                        default=AP_VERSION,
-                        help="Image preprocess with ap_version")
    args = parser.parse_args()
    if args.local:
        convert_pascalvoc_local2bin(args)

--- a/paddle/fluid/inference/tests/api/test_detection_dataset_preprocess.py
+++ b/paddle/fluid/inference/tests/api/test_detection_dataset_preprocess.py
@@ -17,13 +17,13 @@ import os
 class Test_Preprocess(unittest.TestCase):
    def test_local_convert(self):
        os.system("python full_pascalvoc_test_preprocess.py --choice=local")
    def test_online_convert(self):
        os.system(
-            "python full_pascalvoc_test_preprocess.py --choice=VOC_test_2007")
+            "python full_pascalvoc_test_preprocess.py --choice=VOC_test_2007"
+        )
 if __name__ == '__main__':

--- a/paddle/fluid/pybind/generate_file_structures.py
+++ b/paddle/fluid/pybind/generate_file_structures.py
@@ -25,7 +25,8 @@ if __name__ == "__main__":
    for i in range(split_count):
        empty_files.append(
-            os.path.join(pybind_dir, "op_function" + str(i + 1) + ".cc"))
+            os.path.join(pybind_dir, "op_function" + str(i + 1) + ".cc")
+        )
    for path in empty_files:
        if not os.path.exists(path):

--- a/paddle/infrt/tests/models/abs_model.py
+++ b/paddle/infrt/tests/models/abs_model.py
@@ -19,7 +19,6 @@ import sys
 class AbsNet(paddle.nn.Layer):
    def __init__(self):
        super(AbsNet, self).__init__()
@@ -32,6 +31,7 @@ if __name__ == '__main__':
    # build network
    model = AbsNet()
    # save inferencing format model
-    net = to_static(model,
+    net = to_static(
-                    input_spec=[InputSpec(shape=[None, 1, 28, 28], name='x')])
+        model, input_spec=[InputSpec(shape=[None, 1, 28, 28], name='x')]
+    )
    paddle.jit.save(net, sys.argv[1])
--- a/paddle/infrt/tests/models/efficientnet-b4/model.py
+++ b/paddle/infrt/tests/models/efficientnet-b4/model.py
@@ -20,6 +20,7 @@ import paddle
 import sys
 model = EfficientNet.from_name('efficientnet-b4')
-net = to_static(model,
+net = to_static(
-                input_spec=[InputSpec(shape=[None, 3, 256, 256], name='x')])
+    model, input_spec=[InputSpec(shape=[None, 3, 256, 256], name='x')]
+)
 paddle.jit.save(net, sys.argv[1])
--- a/paddle/infrt/tests/models/efficientnet-b4/net/efficientnet.py
+++ b/paddle/infrt/tests/models/efficientnet-b4/net/efficientnet.py
@@ -16,9 +16,15 @@ import paddle
 import paddle.nn as nn
 import paddle.nn.functional as F
-from .utils import (round_filters, round_repeats, drop_connect,
+from .utils import (
-                    get_same_padding_conv2d, get_model_params,
+    round_filters,
-                    efficientnet_params, load_pretrained_weights)
+    round_repeats,
+    drop_connect,
+    get_same_padding_conv2d,
+    get_model_params,
+    efficientnet_params,
+    load_pretrained_weights,
+)
 class MBConvBlock(nn.Layer):
@@ -38,8 +44,9 @@ class MBConvBlock(nn.Layer):
        self._block_args = block_args
        self._bn_mom = global_params.batch_norm_momentum
        self._bn_eps = global_params.batch_norm_epsilon
-        self.has_se = (self._block_args.se_ratio
+        self.has_se = (self._block_args.se_ratio is not None) and (
-                       is not None) and (0 < self._block_args.se_ratio <= 1)
+            0 < self._block_args.se_ratio <= 1
+        )
        self.id_skip = block_args.id_skip  # skip connection and drop connect
        # Get static or dynamic convolution depending on image size
@@ -47,15 +54,19 @@ class MBConvBlock(nn.Layer):
        # Expansion phase
        inp = self._block_args.input_filters  # number of input channels
-        oup = self._block_args.input_filters * self._block_args.expand_ratio  # number of output channels
+        oup = (
+            self._block_args.input_filters * self._block_args.expand_ratio
+        )  # number of output channels
        if self._block_args.expand_ratio != 1:
-            self._expand_conv = Conv2d(in_channels=inp,
+            self._expand_conv = Conv2d(
-                                       out_channels=oup,
+                in_channels=inp,
-                                       kernel_size=1,
+                out_channels=oup,
-                                       bias_attr=False)
+                kernel_size=1,
-            self._bn0 = nn.BatchNorm2D(num_features=oup,
+                bias_attr=False,
-                                       momentum=self._bn_mom,
+            )
-                                       epsilon=self._bn_eps)
+            self._bn0 = nn.BatchNorm2D(
+                num_features=oup, momentum=self._bn_mom, epsilon=self._bn_eps
+            )
        # Depthwise convolution phase
        k = self._block_args.kernel_size
@@ -66,32 +77,40 @@ class MBConvBlock(nn.Layer):
            groups=oup,  # groups makes it depthwise
            kernel_size=k,
            stride=s,
-            bias_attr=False)
+            bias_attr=False,
-        self._bn1 = nn.BatchNorm2D(num_features=oup,
+        )
-                                   momentum=self._bn_mom,
+        self._bn1 = nn.BatchNorm2D(
-                                   epsilon=self._bn_eps)
+            num_features=oup, momentum=self._bn_mom, epsilon=self._bn_eps
+        )
        # Squeeze and Excitation layer, if desired
        if self.has_se:
            num_squeezed_channels = max(
                1,
-                int(self._block_args.input_filters * self._block_args.se_ratio))
+                int(self._block_args.input_filters * self._block_args.se_ratio),
-            self._se_reduce = Conv2d(in_channels=oup,
+            )
-                                     out_channels=num_squeezed_channels,
+            self._se_reduce = Conv2d(
-                                     kernel_size=1)
+                in_channels=oup,
-            self._se_expand = Conv2d(in_channels=num_squeezed_channels,
+                out_channels=num_squeezed_channels,
-                                     out_channels=oup,
+                kernel_size=1,
-                                     kernel_size=1)
+            )
+            self._se_expand = Conv2d(
+                in_channels=num_squeezed_channels,
+                out_channels=oup,
+                kernel_size=1,
+            )
        # Output phase
        final_oup = self._block_args.output_filters
-        self._project_conv = Conv2d(in_channels=oup,
+        self._project_conv = Conv2d(
-                                    out_channels=final_oup,
+            in_channels=oup,
-                                    kernel_size=1,
+            out_channels=final_oup,
-                                    bias_attr=False)
+            kernel_size=1,
-        self._bn2 = nn.BatchNorm2D(num_features=final_oup,
+            bias_attr=False,
-                                   momentum=self._bn_mom,
+        )
-                                   epsilon=self._bn_eps)
+        self._bn2 = nn.BatchNorm2D(
+            num_features=final_oup, momentum=self._bn_mom, epsilon=self._bn_eps
+        )
        self._swish = nn.Hardswish()
    def forward(self, inputs, drop_connect_rate=None):
@@ -111,18 +130,26 @@ class MBConvBlock(nn.Layer):
        if self.has_se:
            x_squeezed = F.adaptive_avg_pool2d(x, 1)
            x_squeezed = self._se_expand(
-                self._swish(self._se_reduce(x_squeezed)))
+                self._swish(self._se_reduce(x_squeezed))
+            )
            x = F.sigmoid(x_squeezed) * x
        x = self._bn2(self._project_conv(x))
        # Skip connection and drop connect
-        input_filters, output_filters = self._block_args.input_filters, self._block_args.output_filters
+        input_filters, output_filters = (
-        if self.id_skip and self._block_args.stride == 1 and input_filters == output_filters:
+            self._block_args.input_filters,
+            self._block_args.output_filters,
+        )
+        if (
+            self.id_skip
+            and self._block_args.stride == 1
+            and input_filters == output_filters
+        ):
            if drop_connect_rate:
-                x = drop_connect(x,
+                x = drop_connect(
-                                 prob=drop_connect_rate,
+                    x, prob=drop_connect_rate, training=self.training
-                                 training=self.training)
+                )
            x = x + inputs  # skip connection
        return x
@@ -161,15 +188,14 @@ class EfficientNet(nn.Layer):
        # Stem
        in_channels = 3  # rgb
        out_channels = round_filters(
-            32, self._global_params)  # number of output channels
+            32, self._global_params
-        self._conv_stem = Conv2d(in_channels,
+        )  # number of output channels
-                                 out_channels,
+        self._conv_stem = Conv2d(
-                                 kernel_size=3,
+            in_channels, out_channels, kernel_size=3, stride=2, bias_attr=False
-                                 stride=2,
+        )
-                                 bias_attr=False)
+        self._bn0 = nn.BatchNorm2D(
-        self._bn0 = nn.BatchNorm2D(num_features=out_channels,
+            num_features=out_channels, momentum=bn_mom, epsilon=bn_eps
-                                   momentum=bn_mom,
+        )
-                                   epsilon=bn_eps)
        # Build blocks
        self._blocks = nn.LayerList([])
@@ -177,32 +203,37 @@ class EfficientNet(nn.Layer):
            # Update block input and output filters based on depth multiplier.
            block_args = block_args._replace(
-                input_filters=round_filters(block_args.input_filters,
+                input_filters=round_filters(
-                                            self._global_params),
+                    block_args.input_filters, self._global_params
-                output_filters=round_filters(block_args.output_filters,
+                ),
-                                             self._global_params),
+                output_filters=round_filters(
-                num_repeat=round_repeats(block_args.num_repeat,
+                    block_args.output_filters, self._global_params
-                                         self._global_params))
+                ),
+                num_repeat=round_repeats(
+                    block_args.num_repeat, self._global_params
+                ),
+            )
            # The first block needs to take care of stride and filter size increase.
            self._blocks.append(MBConvBlock(block_args, self._global_params))
            if block_args.num_repeat > 1:
                block_args = block_args._replace(
-                    input_filters=block_args.output_filters, stride=1)
+                    input_filters=block_args.output_filters, stride=1
+                )
            for _ in range(block_args.num_repeat - 1):
-                self._blocks.append(MBConvBlock(block_args,
+                self._blocks.append(
-                                                self._global_params))
+                    MBConvBlock(block_args, self._global_params)
+                )
        # Head
        in_channels = block_args.output_filters  # output of final block
        out_channels = round_filters(1280, self._global_params)
-        self._conv_head = Conv2d(in_channels,
+        self._conv_head = Conv2d(
-                                 out_channels,
+            in_channels, out_channels, kernel_size=1, bias_attr=False
-                                 kernel_size=1,
+        )
-                                 bias_attr=False)
+        self._bn1 = nn.BatchNorm2D(
-        self._bn1 = nn.BatchNorm2D(num_features=out_channels,
+            num_features=out_channels, momentum=bn_mom, epsilon=bn_eps
-                                   momentum=bn_mom,
+        )
-                                   epsilon=bn_eps)
        # Final linear layer
        self._avg_pooling = nn.AdaptiveAvgPool2D(1)
@@ -217,7 +248,7 @@ class EfficientNet(nn.Layer):
            block.set_swish(memory_efficient)
    def extract_features(self, inputs):
-        """ Returns output of the final convolution layer """
+        """Returns output of the final convolution layer"""
        # Stem
        x = self._swish(self._bn0(self._conv_stem(inputs)))
@@ -235,7 +266,7 @@ class EfficientNet(nn.Layer):
        return x
    def forward(self, inputs):
-        """ Calls extract_features to extract features, applies final linear layer, and returns logits. """
+        """Calls extract_features to extract features, applies final linear layer, and returns logits."""
        bs = inputs.shape[0]
        # Convolution layers
        x = self.extract_features(inputs)
@@ -250,31 +281,33 @@ class EfficientNet(nn.Layer):
    @classmethod
    def from_name(cls, model_name, override_params=None):
        cls._check_model_name_is_valid(model_name)
-        blocks_args, global_params = get_model_params(model_name,
+        blocks_args, global_params = get_model_params(
-                                                      override_params)
+            model_name, override_params
+        )
        return cls(blocks_args, global_params)
    @classmethod
-    def from_pretrained(cls,
+    def from_pretrained(
-                        model_name,
+        cls, model_name, advprop=False, num_classes=1000, in_channels=3
-                        advprop=False,
+    ):
-                        num_classes=1000,
+        model = cls.from_name(
-                        in_channels=3):
+            model_name, override_params={'num_classes': num_classes}
-        model = cls.from_name(model_name,
+        )
-                              override_params={'num_classes': num_classes})
+        load_pretrained_weights(
-        load_pretrained_weights(model,
+            model, model_name, load_fc=(num_classes == 1000), advprop=advprop
-                                model_name,
+        )
-                                load_fc=(num_classes == 1000),
-                                advprop=advprop)
        if in_channels != 3:
            Conv2d = get_same_padding_conv2d(
-                image_size=model._global_params.image_size)
+                image_size=model._global_params.image_size
+            )
            out_channels = round_filters(32, model._global_params)
-            model._conv_stem = Conv2d(in_channels,
+            model._conv_stem = Conv2d(
-                                      out_channels,
+                in_channels,
-                                      kernel_size=3,
+                out_channels,
-                                      stride=2,
+                kernel_size=3,
-                                      bias_attr=False)
+                stride=2,
+                bias_attr=False,
+            )
        return model
    @classmethod
@@ -285,8 +318,9 @@ class EfficientNet(nn.Layer):
    @classmethod
    def _check_model_name_is_valid(cls, model_name):
-        """ Validates model name. """
+        """Validates model name."""
        valid_models = ['efficientnet-b' + str(i) for i in range(9)]
        if model_name not in valid_models:
-            raise ValueError('model_name should be one of: ' +
+            raise ValueError(
-                             ', '.join(valid_models))
+                'model_name should be one of: ' + ', '.join(valid_models)
+            )
--- a/paddle/infrt/tests/models/efficientnet-b4/net/utils.py
+++ b/paddle/infrt/tests/models/efficientnet-b4/net/utils.py
@@ -22,25 +22,44 @@ import paddle.nn as nn
 import paddle.nn.functional as F
 # Parameters for the entire model (stem, all blocks, and head)
-GlobalParams = collections.namedtuple('GlobalParams', [
+GlobalParams = collections.namedtuple(
-    'batch_norm_momentum', 'batch_norm_epsilon', 'dropout_rate', 'num_classes',
+    'GlobalParams',
-    'width_coefficient', 'depth_coefficient', 'depth_divisor', 'min_depth',
+    [
-    'drop_connect_rate', 'image_size'
+        'batch_norm_momentum',
-])
+        'batch_norm_epsilon',
+        'dropout_rate',
+        'num_classes',
+        'width_coefficient',
+        'depth_coefficient',
+        'depth_divisor',
+        'min_depth',
+        'drop_connect_rate',
+        'image_size',
+    ],
+)
 # Parameters for an individual model block
-BlockArgs = collections.namedtuple('BlockArgs', [
+BlockArgs = collections.namedtuple(
-    'kernel_size', 'num_repeat', 'input_filters', 'output_filters',
+    'BlockArgs',
-    'expand_ratio', 'id_skip', 'stride', 'se_ratio'
+    [
-])
+        'kernel_size',
+        'num_repeat',
+        'input_filters',
+        'output_filters',
+        'expand_ratio',
+        'id_skip',
+        'stride',
+        'se_ratio',
+    ],
+)
 # Change namedtuple defaults
-GlobalParams.__new__.__defaults__ = (None, ) * len(GlobalParams._fields)
+GlobalParams.__new__.__defaults__ = (None,) * len(GlobalParams._fields)
-BlockArgs.__new__.__defaults__ = (None, ) * len(BlockArgs._fields)
+BlockArgs.__new__.__defaults__ = (None,) * len(BlockArgs._fields)
 def round_filters(filters, global_params):
-    """ Calculate and round number of filters based on depth multiplier. """
+    """Calculate and round number of filters based on depth multiplier."""
    multiplier = global_params.width_coefficient
    if not multiplier:
        return filters
@@ -48,15 +67,16 @@ def round_filters(filters, global_params):
    min_depth = global_params.min_depth
    filters *= multiplier
    min_depth = min_depth or divisor
-    new_filters = max(min_depth,
+    new_filters = max(
-                      int(filters + divisor / 2) // divisor * divisor)
+        min_depth, int(filters + divisor / 2) // divisor * divisor
+    )
    if new_filters < 0.9 * filters:  # prevent rounding by more than 10%
        new_filters += divisor
    return int(new_filters)
 def round_repeats(repeats, global_params):
-    """ Round number of filters based on depth multiplier. """
+    """Round number of filters based on depth multiplier."""
    multiplier = global_params.depth_coefficient
    if not multiplier:
        return repeats
@@ -76,8 +96,8 @@ def drop_connect(inputs, prob, training):
 def get_same_padding_conv2d(image_size=None):
-    """ Chooses static padding if you have specified an image size, and dynamic padding otherwise.
+    """Chooses static padding if you have specified an image size, and dynamic padding otherwise.
-        Static padding is necessary for ONNX exporting of models. """
+    Static padding is necessary for ONNX exporting of models."""
    if image_size is None:
        return Conv2dDynamicSamePadding
    else:
@@ -85,26 +105,31 @@ def get_same_padding_conv2d(image_size=None):
 class Conv2dDynamicSamePadding(nn.Conv2D):
-    """ 2D Convolutions like TensorFlow, for a dynamic image size """
+    """2D Convolutions like TensorFlow, for a dynamic image size"""
-    def __init__(self,
+    def __init__(
-                 in_channels,
+        self,
-                 out_channels,
+        in_channels,
-                 kernel_size,
+        out_channels,
-                 stride=1,
+        kernel_size,
-                 dilation=1,
+        stride=1,
-                 groups=1,
+        dilation=1,
-                 bias_attr=None):
+        groups=1,
-        super().__init__(in_channels,
+        bias_attr=None,
-                         out_channels,
+    ):
-                         kernel_size,
+        super().__init__(
-                         stride,
+            in_channels,
-                         0,
+            out_channels,
-                         dilation,
+            kernel_size,
-                         groups,
+            stride,
-                         bias_attr=bias_attr)
+            0,
-        self.stride = self._stride if len(
+            dilation,
-            self._stride) == 2 else [self._stride[0]] * 2
+            groups,
+            bias_attr=bias_attr,
+        )
+        self.stride = (
+            self._stride if len(self._stride) == 2 else [self._stride[0]] * 2
+        )
    def forward(self, x):
        ih, iw = x.shape[-2:]
@@ -112,65 +137,84 @@ class Conv2dDynamicSamePadding(nn.Conv2D):
        sh, sw = self.stride
        oh, ow = math.ceil(ih / sh), math.ceil(iw / sw)
        pad_h = max(
-            (oh - 1) * self.stride[0] + (kh - 1) * self._dilation[0] + 1 - ih,
+            (oh - 1) * self.stride[0] + (kh - 1) * self._dilation[0] + 1 - ih, 0
-            0)
+        )
        pad_w = max(
-            (ow - 1) * self.stride[1] + (kw - 1) * self._dilation[1] + 1 - iw,
+            (ow - 1) * self.stride[1] + (kw - 1) * self._dilation[1] + 1 - iw, 0
-            0)
+        )
        if pad_h > 0 or pad_w > 0:
-            x = F.pad(x, [
+            x = F.pad(
-                pad_w // 2, pad_w - pad_w // 2, pad_h // 2, pad_h - pad_h // 2
+                x,
-            ])
+                [
-        return F.conv2d(x, self.weight, self.bias, self.stride, self._padding,
+                    pad_w // 2,
-                        self._dilation, self._groups)
+                    pad_w - pad_w // 2,
+                    pad_h // 2,
+                    pad_h - pad_h // 2,
+                ],
+            )
+        return F.conv2d(
+            x,
+            self.weight,
+            self.bias,
+            self.stride,
+            self._padding,
+            self._dilation,
+            self._groups,
+        )
 class Conv2dStaticSamePadding(nn.Conv2D):
-    """ 2D Convolutions like TensorFlow, for a fixed image size"""
+    """2D Convolutions like TensorFlow, for a fixed image size"""
-    def __init__(self,
+    def __init__(
-                 in_channels,
+        self, in_channels, out_channels, kernel_size, image_size=None, **kwargs
-                 out_channels,
+    ):
-                 kernel_size,
-                 image_size=None,
-                 **kwargs):
        if 'stride' in kwargs and isinstance(kwargs['stride'], list):
            kwargs['stride'] = kwargs['stride'][0]
        super().__init__(in_channels, out_channels, kernel_size, **kwargs)
-        self.stride = self._stride if len(
+        self.stride = (
-            self._stride) == 2 else [self._stride[0]] * 2
+            self._stride if len(self._stride) == 2 else [self._stride[0]] * 2
+        )
        # Calculate padding based on image size and save it
        assert image_size is not None
-        ih, iw = image_size if type(image_size) == list else [
+        ih, iw = (
-            image_size, image_size
+            image_size if type(image_size) == list else [image_size, image_size]
-        ]
+        )
        kh, kw = self.weight.shape[-2:]
        sh, sw = self.stride
        oh, ow = math.ceil(ih / sh), math.ceil(iw / sw)
        pad_h = max(
-            (oh - 1) * self.stride[0] + (kh - 1) * self._dilation[0] + 1 - ih,
+            (oh - 1) * self.stride[0] + (kh - 1) * self._dilation[0] + 1 - ih, 0
-            0)
+        )
        pad_w = max(
-            (ow - 1) * self.stride[1] + (kw - 1) * self._dilation[1] + 1 - iw,
+            (ow - 1) * self.stride[1] + (kw - 1) * self._dilation[1] + 1 - iw, 0
-            0)
+        )
        if pad_h > 0 or pad_w > 0:
-            self.static_padding = nn.Pad2D([
+            self.static_padding = nn.Pad2D(
-                pad_w // 2, pad_w - pad_w // 2, pad_h // 2, pad_h - pad_h // 2
+                [pad_w // 2, pad_w - pad_w // 2, pad_h // 2, pad_h - pad_h // 2]
-            ])
+            )
        else:
            self.static_padding = Identity()
    def forward(self, x):
        x = self.static_padding(x)
-        x = F.conv2d(x, self.weight, self.bias, self.stride, self._padding,
+        x = F.conv2d(
-                     self._dilation, self._groups)
+            x,
+            self.weight,
+            self.bias,
+            self.stride,
+            self._padding,
+            self._dilation,
+            self._groups,
+        )
        return x
 class Identity(nn.Layer):
+    def __init__(
-    def __init__(self, ):
+        self,
+    ):
        super().__init__()
    def forward(self, x):
@@ -178,7 +222,7 @@ class Identity(nn.Layer):
 def efficientnet_params(model_name):
-    """ Map EfficientNet model name to parameter coefficients. """
+    """Map EfficientNet model name to parameter coefficients."""
    params_dict = {
        # Coefficients:   width,depth,resolution,dropout
        'efficientnet-b0': (1.0, 1.0, 224, 0.2),
@@ -196,11 +240,11 @@ def efficientnet_params(model_name):
 class BlockDecoder(object):
-    """ Block Decoder for readability, straight from the official TensorFlow repository """
+    """Block Decoder for readability, straight from the official TensorFlow repository"""
    @staticmethod
    def _decode_block_string(block_string):
-        """ Gets a block through a string notation of arguments. """
+        """Gets a block through a string notation of arguments."""
        assert isinstance(block_string, str)
        ops = block_string.split('_')
@@ -212,8 +256,9 @@ class BlockDecoder(object):
                options[key] = value
        # Check stride
-        assert (('s' in options and len(options['s']) == 1) or
+        assert ('s' in options and len(options['s']) == 1) or (
-                (len(options['s']) == 2 and options['s'][0] == options['s'][1]))
+            len(options['s']) == 2 and options['s'][0] == options['s'][1]
+        )
        return BlockArgs(
            kernel_size=int(options['k']),
@@ -223,7 +268,8 @@ class BlockDecoder(object):
            expand_ratio=int(options['e']),
            id_skip=('noskip' not in block_string),
            se_ratio=float(options['se']) if 'se' in options else None,
-            stride=[int(options['s'][0])])
+            stride=[int(options['s'][0])],
+        )
    @staticmethod
    def _encode_block_string(block):
@@ -234,7 +280,7 @@ class BlockDecoder(object):
            's%d%d' % (block.strides[0], block.strides[1]),
            'e%s' % block.expand_ratio,
            'i%d' % block.input_filters,
-            'o%d' % block.output_filters
+            'o%d' % block.output_filters,
        ]
        if 0 < block.se_ratio <= 1:
            args.append('se%s' % block.se_ratio)
@@ -270,13 +316,15 @@ class BlockDecoder(object):
        return block_strings
-def efficientnet(width_coefficient=None,
+def efficientnet(
-                 depth_coefficient=None,
+    width_coefficient=None,
-                 dropout_rate=0.2,
+    depth_coefficient=None,
-                 drop_connect_rate=0.2,
+    dropout_rate=0.2,
-                 image_size=None,
+    drop_connect_rate=0.2,
-                 num_classes=1000):
+    image_size=None,
-    """ Get block arguments according to parameter and coefficients. """
+    num_classes=1000,
+):
+    """Get block arguments according to parameter and coefficients."""
    blocks_args = [
        'r1_k3_s11_e1_i32_o16_se0.25',
        'r2_k3_s22_e6_i16_o24_se0.25',
@@ -305,67 +353,51 @@ def efficientnet(width_coefficient=None,
 def get_model_params(model_name, override_params):
-    """ Get the block args and global params for a given model """
+    """Get the block args and global params for a given model"""
    if model_name.startswith('efficientnet'):
        w, d, s, p = efficientnet_params(model_name)
-        blocks_args, global_params = efficientnet(width_coefficient=w,
+        blocks_args, global_params = efficientnet(
-                                                  depth_coefficient=d,
+            width_coefficient=w,
-                                                  dropout_rate=p,
+            depth_coefficient=d,
-                                                  image_size=s)
+            dropout_rate=p,
+            image_size=s,
+        )
    else:
-        raise NotImplementedError('model name is not pre-defined: %s' %
+        raise NotImplementedError(
-                                  model_name)
+            'model name is not pre-defined: %s' % model_name
+        )
    if override_params:
        global_params = global_params._replace(**override_params)
    return blocks_args, global_params
 url_map = {
-    'efficientnet-b0':
+    'efficientnet-b0': '/home/aistudio/data/weights/efficientnet-b0-355c32eb.pdparams',
-    '/home/aistudio/data/weights/efficientnet-b0-355c32eb.pdparams',
+    'efficientnet-b1': '/home/aistudio/data/weights/efficientnet-b1-f1951068.pdparams',
-    'efficientnet-b1':
+    'efficientnet-b2': '/home/aistudio/data/weights/efficientnet-b2-8bb594d6.pdparams',
-    '/home/aistudio/data/weights/efficientnet-b1-f1951068.pdparams',
+    'efficientnet-b3': '/home/aistudio/data/weights/efficientnet-b3-5fb5a3c3.pdparams',
-    'efficientnet-b2':
+    'efficientnet-b4': '/home/aistudio/data/weights/efficientnet-b4-6ed6700e.pdparams',
-    '/home/aistudio/data/weights/efficientnet-b2-8bb594d6.pdparams',
+    'efficientnet-b5': '/home/aistudio/data/weights/efficientnet-b5-b6417697.pdparams',
-    'efficientnet-b3':
+    'efficientnet-b6': '/home/aistudio/data/weights/efficientnet-b6-c76e70fd.pdparams',
-    '/home/aistudio/data/weights/efficientnet-b3-5fb5a3c3.pdparams',
+    'efficientnet-b7': '/home/aistudio/data/weights/efficientnet-b7-dcc49843.pdparams',
-    'efficientnet-b4':
-    '/home/aistudio/data/weights/efficientnet-b4-6ed6700e.pdparams',
-    'efficientnet-b5':
-    '/home/aistudio/data/weights/efficientnet-b5-b6417697.pdparams',
-    'efficientnet-b6':
-    '/home/aistudio/data/weights/efficientnet-b6-c76e70fd.pdparams',
-    'efficientnet-b7':
-    '/home/aistudio/data/weights/efficientnet-b7-dcc49843.pdparams',
 }
 url_map_advprop = {
-    'efficientnet-b0':
+    'efficientnet-b0': '/home/aistudio/data/weights/adv-efficientnet-b0-b64d5a18.pdparams',
-    '/home/aistudio/data/weights/adv-efficientnet-b0-b64d5a18.pdparams',
+    'efficientnet-b1': '/home/aistudio/data/weights/adv-efficientnet-b1-0f3ce85a.pdparams',
-    'efficientnet-b1':
+    'efficientnet-b2': '/home/aistudio/data/weights/adv-efficientnet-b2-6e9d97e5.pdparams',
-    '/home/aistudio/data/weights/adv-efficientnet-b1-0f3ce85a.pdparams',
+    'efficientnet-b3': '/home/aistudio/data/weights/adv-efficientnet-b3-cdd7c0f4.pdparams',
-    'efficientnet-b2':
+    'efficientnet-b4': '/home/aistudio/data/weights/adv-efficientnet-b4-44fb3a87.pdparams',
-    '/home/aistudio/data/weights/adv-efficientnet-b2-6e9d97e5.pdparams',
+    'efficientnet-b5': '/home/aistudio/data/weights/adv-efficientnet-b5-86493f6b.pdparams',
-    'efficientnet-b3':
+    'efficientnet-b6': '/home/aistudio/data/weights/adv-efficientnet-b6-ac80338e.pdparams',
-    '/home/aistudio/data/weights/adv-efficientnet-b3-cdd7c0f4.pdparams',
+    'efficientnet-b7': '/home/aistudio/data/weights/adv-efficientnet-b7-4652b6dd.pdparams',
-    'efficientnet-b4':
+    'efficientnet-b8': '/home/aistudio/data/weights/adv-efficientnet-b8-22a8fe65.pdparams',
-    '/home/aistudio/data/weights/adv-efficientnet-b4-44fb3a87.pdparams',
-    'efficientnet-b5':
-    '/home/aistudio/data/weights/adv-efficientnet-b5-86493f6b.pdparams',
-    'efficientnet-b6':
-    '/home/aistudio/data/weights/adv-efficientnet-b6-ac80338e.pdparams',
-    'efficientnet-b7':
-    '/home/aistudio/data/weights/adv-efficientnet-b7-4652b6dd.pdparams',
-    'efficientnet-b8':
-    '/home/aistudio/data/weights/adv-efficientnet-b8-22a8fe65.pdparams',
 }
-def load_pretrained_weights(model,
+def load_pretrained_weights(
-                            model_name,
+    model, model_name, weights_path=None, load_fc=True, advprop=False
-                            weights_path=None,
+):
-                            load_fc=True,
-                            advprop=False):
    """Loads pretrained weights from weights path or download using url.
    Args:
        model (Module): The whole model of efficientnet.

--- a/paddle/infrt/tests/models/linear.py
+++ b/paddle/infrt/tests/models/linear.py
@@ -28,13 +28,12 @@ CLASS_NUM = 10
 # define a random dataset
 class RandomDataset(paddle.io.Dataset):
    def __init__(self, num_samples):
        self.num_samples = num_samples
    def __getitem__(self, idx):
        image = np.random.random([IMAGE_SIZE]).astype('float32')
-        label = np.random.randint(0, CLASS_NUM - 1, (1, )).astype('int64')
+        label = np.random.randint(0, CLASS_NUM - 1, (1,)).astype('int64')
        return image, label
    def __len__(self):
@@ -42,7 +41,6 @@ class RandomDataset(paddle.io.Dataset):
 class LinearNet(nn.Layer):
    def __init__(self):
        super(LinearNet, self).__init__()
        self._linear = nn.Linear(IMAGE_SIZE, CLASS_NUM)
@@ -71,11 +69,9 @@ adam = opt.Adam(learning_rate=0.001, parameters=layer.parameters())
 # create data loader
 dataset = RandomDataset(BATCH_NUM * BATCH_SIZE)
-loader = paddle.io.DataLoader(dataset,
+loader = paddle.io.DataLoader(
-                              batch_size=BATCH_SIZE,
+    dataset, batch_size=BATCH_SIZE, shuffle=True, drop_last=True, num_workers=2
-                              shuffle=True,
+)
-                              drop_last=True,
-                              num_workers=2)
 # train
 train(layer, loader, loss_fn, adam)

--- a/paddle/infrt/tests/models/resnet50_model.py
+++ b/paddle/infrt/tests/models/resnet50_model.py
@@ -19,6 +19,7 @@ from paddle.static import InputSpec
 import sys
 model = resnet50(True)
-net = to_static(model,
+net = to_static(
-                input_spec=[InputSpec(shape=[None, 3, 256, 256], name='x')])
+    model, input_spec=[InputSpec(shape=[None, 3, 256, 256], name='x')]
+)
 paddle.jit.save(net, sys.argv[1])
--- a/paddle/phi/api/yaml/generator/api_base.py
+++ b/paddle/phi/api/yaml/generator/api_base.py
--- a/paddle/phi/api/yaml/generator/api_gen.py
+++ b/paddle/phi/api/yaml/generator/api_gen.py
@@ -20,23 +20,24 @@ from api_base import BaseAPI, PREFIX_TENSOR_NAME
 inplace_out_type_map = {
    "Tensor": "Tensor&",
-    "std::vector<Tensor>": "std::vector<Tensor>&"
+    "std::vector<Tensor>": "std::vector<Tensor>&",
 }
 inplace_optional_out_type_map = {
    "Tensor": "paddle::optional<Tensor>&",
-    "std::vector<Tensor>": "paddle::optional<std::vector<Tensor>>&"
+    "std::vector<Tensor>": "paddle::optional<std::vector<Tensor>>&",
 }
 class ForwardAPI(BaseAPI):
    def __init__(self, api_item_yaml):
        super(ForwardAPI, self).__init__(api_item_yaml)
        self.is_dygraph_api, self.intermediate_outs = self.parse_intermediate(
-            api_item_yaml)
+            api_item_yaml
+        )
        self.inplace_map, self.view_map = self.parse_inplace_and_view(
-            api_item_yaml)
+            api_item_yaml
+        )
    def get_api_func_name(self):
        if self.is_dygraph_api:
@@ -47,17 +48,26 @@ class ForwardAPI(BaseAPI):
    def gene_input(self, kernel_tensor_type=None, code_indent=''):
        kernel_param = self.kernel['param']
        input_name_tensor_map, input_tensor_code = super().gene_input(
-            kernel_tensor_type, code_indent)
+            kernel_tensor_type, code_indent
+        )
        # generate the input that is in view list
        for i, input_name in enumerate(self.inputs['names']):
-            if input_name in self.view_map.values(
+            if (
-            ) and input_name not in input_name_tensor_map.keys():
+                input_name in self.view_map.values()
-                if kernel_tensor_type is None or kernel_tensor_type[0][
+                and input_name not in input_name_tensor_map.keys()
-                        kernel_param.index(input_name)] == 'dense':
+            ):
+                if (
+                    kernel_tensor_type is None
+                    or kernel_tensor_type[0][kernel_param.index(input_name)]
+                    == 'dense'
+                ):
                    trans_flag = self.gene_trans_flag(input_name)
-                    input_tensor_code = input_tensor_code + f"""
+                    input_tensor_code = (
+                        input_tensor_code
+                        + f"""
 {code_indent}  auto {PREFIX_TENSOR_NAME}{input_name} = PrepareData({input_name}, kernel.InputAt(0), {trans_flag});"""
+                    )
                else:
                    # do nothing
                    pass
@@ -87,10 +97,12 @@ class ForwardAPI(BaseAPI):
                    result = re.search(r"(?P<in>\w+)\s*->\s*(?P<out>\w+)", item)
                    in_val = result.group('in')
                    out_val = result.group('out')
-                    assert in_val in self.inputs['names'], \
+                    assert (
-                        f"{self.api} : {mode} input error: the input var name('{in_val}') is not found in the input args of {self.api}."
+                        in_val in self.inputs['names']
-                    assert out_val in self.outputs['names'], \
+                    ), f"{self.api} : {mode} input error: the input var name('{in_val}') is not found in the input args of {self.api}."
-                        f"{self.api} : {mode} output error: the output var name('{out_val}') is not found in the output args of {self.api}."
+                    assert (
+                        out_val in self.outputs['names']
+                    ), f"{self.api} : {mode} output error: the output var name('{out_val}') is not found in the output args of {self.api}."
                    if mode == 'inplace':
                        inplace_map[out_val] = in_val
@@ -106,7 +118,8 @@ class ForwardAPI(BaseAPI):
            if inplace_flag and out_name in self.inplace_map:
                if self.inplace_map[out_name] in self.optional_vars:
                    out_type_list.append(
-                        inplace_optional_out_type_map[out_type])
+                        inplace_optional_out_type_map[out_type]
+                    )
                else:
                    out_type_list.append(inplace_out_type_map[out_type])
            else:
@@ -124,7 +137,8 @@ class ForwardAPI(BaseAPI):
            if inplace_flag and out_name in self.inplace_map:
                if self.inplace_map[out_name] in self.optional_vars:
                    out_type_list.append(
-                        inplace_optional_out_type_map[out_type])
+                        inplace_optional_out_type_map[out_type]
+                    )
                else:
                    out_type_list.append(inplace_out_type_map[out_type])
            elif self.is_dygraph_api or out_name not in self.intermediate_outs:
@@ -151,11 +165,13 @@ class ForwardAPI(BaseAPI):
                ]
            return 'return std::make_tuple(' + ", ".join(selected_code) + ');'
-    def gene_output(self,
+    def gene_output(
-                    out_dtype_list,
+        self,
-                    out_tensor_type_list=None,
+        out_dtype_list,
-                    code_indent='',
+        out_tensor_type_list=None,
-                    inplace_flag=False):
+        code_indent='',
+        inplace_flag=False,
+    ):
        kernel_output = []
        output_names = []
        output_create = ""
@@ -164,29 +180,48 @@ class ForwardAPI(BaseAPI):
        if len(out_dtype_list) == 1:
            kernel_output.append('kernel_out')
            output_names.append('kernel_out')
-            inplace_assign = " = " + self.inplace_map[
+            inplace_assign = (
-                self.outputs['names'][0]] if inplace_flag and self.outputs[
+                " = " + self.inplace_map[self.outputs['names'][0]]
-                    'names'][0] in self.inplace_map else ""
+                if inplace_flag and self.outputs['names'][0] in self.inplace_map
+                else ""
+            )
            output_create = f"""
 {code_indent}  {return_type} api_output{inplace_assign};"""
-            set_out_func = 'SetKernelOutput' if out_tensor_type_list is None or out_tensor_type_list[
+            set_out_func = (
-                0] == 'dense' else 'SetSelectedRowsKernelOutput'
+                'SetKernelOutput'
+                if out_tensor_type_list is None
+                or out_tensor_type_list[0] == 'dense'
+                else 'SetSelectedRowsKernelOutput'
+            )
            if return_type == 'std::vector<Tensor>':
-                assert self.outputs['out_size_expr'][0] is not None, \
+                assert (
-                     f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
+                    self.outputs['out_size_expr'][0] is not None
-                output_create = output_create + f"""
+                ), f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
+                output_create = (
+                    output_create
+                    + f"""
 {code_indent}  auto kernel_out = {set_out_func}({self.outputs['out_size_expr'][0]}, &api_output);"""
+                )
            else:
-                output_create = output_create + f"""
+                output_create = (
+                    output_create
+                    + f"""
 {code_indent}  auto kernel_out = {set_out_func}(&api_output);"""
+                )
-            if not inplace_flag and self.view_map is not None and self.outputs[
-                    'names'][0] in self.view_map:
+            if (
-                output_create = output_create + f"""
+                not inplace_flag
+                and self.view_map is not None
+                and self.outputs['names'][0] in self.view_map
+            ):
+                output_create = (
+                    output_create
+                    + f"""
 {code_indent}  kernel_out->ShareBufferWith(*{PREFIX_TENSOR_NAME}{self.view_map[self.outputs['names'][0]]});
 {code_indent}  kernel_out->ShareInplaceVersionCounterWith(*{PREFIX_TENSOR_NAME}{self.view_map[self.outputs['names'][0]]});
 {code_indent}  VLOG(3) << "Perform View between Output and Input Tensor, share allocation and inplace version.";"""
+                )
        elif len(out_dtype_list) > 1:
            output_create = f"""
@@ -206,47 +241,74 @@ class ForwardAPI(BaseAPI):
            for i in range(len(out_dtype_list)):
                kernel_output.append(f'kernel_out_{i}')
                output_names.append(f'kernel_out_{i}')
-                set_out_func = 'SetKernelOutput' if out_tensor_type_list is None or out_tensor_type_list[
+                set_out_func = (
-                    i] == 'dense' else 'SetSelectedRowsKernelOutput'
+                    'SetKernelOutput'
+                    if out_tensor_type_list is None
+                    or out_tensor_type_list[i] == 'dense'
+                    else 'SetSelectedRowsKernelOutput'
+                )
                get_out_code = f"&std::get<{i}>(api_output)"
-                if self.outputs['names'][
+                if (
-                        i] in self.inplace_map and self.inplace_map[
+                    self.outputs['names'][i] in self.inplace_map
-                            self.outputs['names'][i]] in self.optional_vars:
+                    and self.inplace_map[self.outputs['names'][i]]
+                    in self.optional_vars
+                ):
                    get_out_code = f"std::get<{i}>(api_output).get_ptr()"
                if out_dtype_list[i] == 'std::vector<Tensor>':
-                    assert self.outputs['out_size_expr'][i] is not None, \
+                    assert (
-                        f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
+                        self.outputs['out_size_expr'][i] is not None
+                    ), f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
                    # Special case for inplace vector and inplace optional<vector>
                    if self.outputs['names'][i] in self.inplace_map:
                        set_out_func = "SetInplaceVectorKernelOutput"
-                        if self.inplace_map[self.outputs['names']
+                        if (
-                                            [i]] in self.optional_vars:
+                            self.inplace_map[self.outputs['names'][i]]
-                            set_out_func = "SetInplaceOptionalVectorKernelOutput"
+                            in self.optional_vars
+                        ):
+                            set_out_func = (
+                                "SetInplaceOptionalVectorKernelOutput"
+                            )
                            get_out_code = f"std::get<{i}>(api_output)"
-                    output_create = output_create + f"""
+                    output_create = (
+                        output_create
+                        + f"""
 {code_indent}  auto kernel_out_{i} = {set_out_func}({self.outputs['out_size_expr'][i]}, {get_out_code});"""
+                    )
                else:
-                    output_create = output_create + f"""
+                    output_create = (
+                        output_create
+                        + f"""
 {code_indent}  auto kernel_out_{i} = {set_out_func}({get_out_code});"""
+                    )
-                if not inplace_flag and self.view_map is not None and self.outputs[
+                if (
-                        'names'][i] in self.view_map:
+                    not inplace_flag
+                    and self.view_map is not None
+                    and self.outputs['names'][i] in self.view_map
+                ):
                    if out_dtype_list[i] == 'Tensor':
-                        output_create = output_create + f"""
+                        output_create = (
+                            output_create
+                            + f"""
    {code_indent}  kernel_out_{i}->ShareBufferWith(*{PREFIX_TENSOR_NAME}{self.view_map[self.outputs['names'][i]]});
    {code_indent}  kernel_out_{i}->ShareInplaceVersionCounterWith(*{PREFIX_TENSOR_NAME}{self.view_map[self.outputs['names'][i]]});
    {code_indent}  VLOG(3) << "Perform View between Output and Input Tensor, share allocation and inplace version.";"""
+                        )
                    else:
                        raise ValueError(
-                            "{} : Output error: only support Tensor type when use view in yaml. But get {}"
+                            "{} : Output error: only support Tensor type when use view in yaml. But get {}".format(
-                            .format(self.api, out_dtype_list[i]))
+                                self.api, out_dtype_list[i]
+                            )
+                        )
        else:
            raise ValueError(
                "{} : Output error: the output should not be empty.".format(
-                    self.api))
+                    self.api
+                )
+            )
        return kernel_output, output_names, output_create
@@ -288,15 +350,18 @@ DECLARE_bool(conv2d_disable_cudnn);
 def api_namespace():
-    return ("""
+    return (
+        """
 namespace paddle {
 namespace experimental {
-""", """
+""",
+        """
 }  // namespace experimental
 }  // namespace paddle
-""")
+""",
+    )
 def generate_api(api_yaml_path, header_file_path, source_file_path):
@@ -338,19 +403,26 @@ def generate_api(api_yaml_path, header_file_path, source_file_path):
 def main():
    parser = argparse.ArgumentParser(
-        description='Generate PaddlePaddle C++ API files')
+        description='Generate PaddlePaddle C++ API files'
-    parser.add_argument('--api_yaml_path',
+    )
-                        help='path to api yaml file',
+    parser.add_argument(
-                        nargs='+',
+        '--api_yaml_path',
-                        default='paddle/phi/api/yaml/ops.yaml')
+        help='path to api yaml file',
+        nargs='+',
-    parser.add_argument('--api_header_path',
+        default='paddle/phi/api/yaml/ops.yaml',
-                        help='output of generated api header code file',
+    )
-                        default='paddle/phi/api/include/api.h')
+    parser.add_argument(
-    parser.add_argument('--api_source_path',
+        '--api_header_path',
-                        help='output of generated api source code file',
+        help='output of generated api header code file',
-                        default='paddle/phi/api/lib/api.cc')
+        default='paddle/phi/api/include/api.h',
+    )
+    parser.add_argument(
+        '--api_source_path',
+        help='output of generated api source code file',
+        default='paddle/phi/api/lib/api.cc',
+    )
    options = parser.parse_args()

--- a/paddle/phi/api/yaml/generator/backward_api_gen.py
+++ b/paddle/phi/api/yaml/generator/backward_api_gen.py
@@ -20,7 +20,6 @@ from api_base import BaseAPI
 class BackwardAPI(BaseAPI):
    def __init__(self, backward_item_yaml):
        super(BackwardAPI, self).__init__(backward_item_yaml)
        self.check_args(backward_item_yaml['forward'])
@@ -33,12 +32,18 @@ class BackwardAPI(BaseAPI):
        # api_name (const Tensor& input, ... , int attr, ...) -> Tensor(out)
        result = re.search(
            r"(?P<op>[a-z][a-z0-9_]+)\s*(?P<args>\([^\)]+\))\s*->\s*(?P<outputs>.+)",
-            forward_config)
+            forward_config,
+        )
        api = result.group('op')
-        _, outputs, _, = self.parse_output(self.api, result.group('outputs'))
+        (
+            _,
+            outputs,
+            _,
+        ) = self.parse_output(self.api, result.group('outputs'))
        outputs = [item.split('@')[0] for item in outputs]
-        fw_inputs, fw_attrs = self.parse_input_and_attr(api,
+        fw_inputs, fw_attrs = self.parse_input_and_attr(
-                                                        result.group('args'))
+            api, result.group('args')
+        )
        return api, fw_inputs, fw_attrs, outputs
@@ -54,27 +59,34 @@ class BackwardAPI(BaseAPI):
    def check_args(self, forward_config):
        # parse the forward and backward config
        _, fw_inputs, fw_attrs, fw_outputs = self.parse_forward_config(
-            forward_config)
+            forward_config
+        )
        # check the inputs of backward
        for input in self.inputs['names']:
            if input not in fw_inputs['names'] and input not in fw_outputs:
                if input.endswith('_grad'):
                    original_name = input[:-5]
-                    assert original_name in fw_outputs, \
+                    assert (
-                        f"{self.api} : Input Tensor error: the input tensor({input}) of backward should be an input or output or grad of output in forward api. \
+                        original_name in fw_outputs
+                    ), f"{self.api} : Input Tensor error: the input tensor({input}) of backward should be an input or output or grad of output in forward api. \
                         Please check the forward of {self.api} in yaml."
        # check the attributes of backward
        for attr in self.attrs['names']:
-            assert (attr in fw_attrs['names'] and self.attrs['attr_info'][attr][0] == fw_attrs['attr_info'][attr][0]) or \
+            assert (
-                 self.attrs['attr_info'][attr][1] is not None, \
+                attr in fw_attrs['names']
-                f"{self.api} : Attribute error: The attribute({attr}) of backward isn't consistent with forward api or doesn't have default value. \
+                and self.attrs['attr_info'][attr][0]
+                == fw_attrs['attr_info'][attr][0]
+            ) or self.attrs['attr_info'][attr][
+                1
+            ] is not None, f"{self.api} : Attribute error: The attribute({attr}) of backward isn't consistent with forward api or doesn't have default value. \
                 Please check the args of {self.api} in yaml."
        # check the output of backward
-        assert len(self.outputs['types']) <= len(fw_inputs['names']), \
+        assert len(self.outputs['types']) <= len(
-            f"{self.api} : Output error: The number of outputs should be less then the number of inputs of forward api. \
+            fw_inputs['names']
+        ), f"{self.api} : Output error: The number of outputs should be less then the number of inputs of forward api. \
             Please check the output of {self.api} in yaml."
    def get_declare_args(self, inplace_flag=False):
@@ -83,13 +95,16 @@ class BackwardAPI(BaseAPI):
    def get_define_args(self, inplace_flag=False):
        out_type_map = {
            'Tensor': 'Tensor*',
-            'std::vector<Tensor>': 'std::vector<Tensor*>'
+            'std::vector<Tensor>': 'std::vector<Tensor*>',
        }
        intputs_and_attrs = super(BackwardAPI, self).get_define_args()
        outs = []
        for i, name in enumerate(self.outputs['names']):
-            outs.append(out_type_map[self.outputs['types'][i]] + ' ' +
+            outs.append(
-                        name.split('@')[0])
+                out_type_map[self.outputs['types'][i]]
+                + ' '
+                + name.split('@')[0]
+            )
        result = intputs_and_attrs + ', ' + ", ".join(outs)
        return result
@@ -100,7 +115,8 @@ class BackwardAPI(BaseAPI):
        if not self.is_base_api:
            invoke_func_name = self.invoke.split('(')[0]
            if (not invoke_func_name.endswith("_grad")) and (
-                    not invoke_func_name.endswith('_impl')):
+                not invoke_func_name.endswith('_impl')
+            ):
                return ""
        api_func_name = self.get_api_func_name()
        api_declaration = f"""
@@ -124,11 +140,13 @@ PADDLE_API void {api_func_name}({self.get_declare_args()});
    def get_return_type(self, inplace_flag=False):
        return 'void'
-    def gene_output(self,
+    def gene_output(
-                    out_dtype_list,
+        self,
-                    out_tensor_type_list=None,
+        out_dtype_list,
-                    code_indent='',
+        out_tensor_type_list=None,
-                    inplace_flag=False):
+        code_indent='',
+        inplace_flag=False,
+    ):
        kernel_output = []
        output_names = []
        output_create = ""
@@ -136,60 +154,101 @@ PADDLE_API void {api_func_name}({self.get_declare_args()});
        if len(out_dtype_list) == 1:
            kernel_output.append('kernel_out')
            output_names.append('kernel_out')
-            inplace_assign = " = " + self.inplace_map[self.outputs['names'][
+            inplace_assign = (
-                0]] if inplace_flag and self.inplace_map is not None and self.outputs[
+                " = " + self.inplace_map[self.outputs['names'][0]]
-                    'names'][0] in self.inplace_map else ""
+                if inplace_flag
+                and self.inplace_map is not None
+                and self.outputs['names'][0] in self.inplace_map
+                else ""
+            )
            output_create = ""
-            set_out_func = 'SetKernelOutput' if out_tensor_type_list is None or out_tensor_type_list[
+            set_out_func = (
-                0] == 'dense' else 'SetSelectedRowsKernelOutput'
+                'SetKernelOutput'
+                if out_tensor_type_list is None
+                or out_tensor_type_list[0] == 'dense'
+                else 'SetSelectedRowsKernelOutput'
+            )
            if out_dtype_list[0] == 'std::vector<Tensor>':
-                assert self.outputs['out_size_expr'] is not None, \
+                assert (
-                     f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
+                    self.outputs['out_size_expr'] is not None
-                output_create = output_create + f"""
+                ), f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
+                output_create = (
+                    output_create
+                    + f"""
 {code_indent}  auto kernel_out = {set_out_func}(&{self.outputs['names'][0]});"""
+                )
            else:
-                output_create = output_create + f"""
+                output_create = (
+                    output_create
+                    + f"""
 {code_indent}  auto kernel_out = {set_out_func}({self.outputs['names'][0]});"""
+                )
        elif len(out_dtype_list) > 1:
            output_create = ""
            for i, out_type_item in enumerate(out_dtype_list):
                kernel_output.append(f'kernel_out_{i}')
                output_names.append(f'kernel_out_{i}')
-                set_out_func = 'SetKernelOutput' if out_tensor_type_list is None or out_tensor_type_list[
+                set_out_func = (
-                    i] == 'dense' else 'SetSelectedRowsKernelOutput'
+                    'SetKernelOutput'
+                    if out_tensor_type_list is None
+                    or out_tensor_type_list[i] == 'dense'
+                    else 'SetSelectedRowsKernelOutput'
+                )
                if out_type_item == 'Tensor':
-                    if inplace_flag and self.inplace_map is not None and self.outputs[
+                    if (
-                            'names'][i] in self.inplace_map:
+                        inplace_flag
-                        output_create = output_create + f"""
+                        and self.inplace_map is not None
+                        and self.outputs['names'][i] in self.inplace_map
+                    ):
+                        output_create = (
+                            output_create
+                            + f"""
 {code_indent}  *{self.outputs['names'][i]} = {self.inplace_map[self.outputs['names'][i]]};"""
+                        )
-                    output_create = output_create + f"""
+                    output_create = (
+                        output_create
+                        + f"""
 {code_indent}  auto kernel_out_{i} = {set_out_func}({self.outputs['names'][i]});"""
+                    )
                else:
-                    if inplace_flag and self.inplace_map is not None and self.outputs[
+                    if (
-                            'names'][i] in self.inplace_map:
+                        inplace_flag
-                        output_create = output_create + f"""
+                        and self.inplace_map is not None
+                        and self.outputs['names'][i] in self.inplace_map
+                    ):
+                        output_create = (
+                            output_create
+                            + f"""
 {code_indent}  *{self.outputs['names'][i]} = {self.inplace_map[self.outputs['names'][i]]};"""
+                        )
-                    assert self.outputs['out_size_expr'][i] is not None, \
-                        f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
+                    assert (
-                    output_create = output_create + f"""
+                        self.outputs['out_size_expr'][i] is not None
+                    ), f"{self.api}: The out size expr : '{{expr}}' should be set when output has Tensor[]. You can refer 'split' api."
+                    output_create = (
+                        output_create
+                        + f"""
 {code_indent}  auto kernel_out_{i} = {set_out_func}(&{self.outputs['names'][i]});"""
+                    )
        else:
            raise ValueError(
                "{} : Output error: the output should not be empty.".format(
-                    self.api))
+                    self.api
+                )
+            )
        return kernel_output, output_names, output_create
    def gene_invoke_code(self, invoke_code, params_code):
        invoke_func_name = invoke_code.split('(')[0].strip()
        if invoke_func_name.endswith('_grad') or invoke_func_name.endswith(
-                '_impl'):
+            '_impl'
+        ):
            return f"""
 PADDLE_API {self.get_return_type()} {self.api}({params_code}) {{
  {invoke_code};
@@ -235,19 +294,23 @@ DECLARE_bool(conv2d_disable_cudnn);
 def backward_api_namespace():
-    return ("""
+    return (
+        """
 namespace paddle {
 namespace experimental {
-""", """
+""",
+        """
 }  // namespace experimental
 }  // namespace paddle
-""")
+""",
+    )
-def generate_backward_api(backward_yaml_path, header_file_path,
+def generate_backward_api(
-                          source_file_path):
+    backward_yaml_path, header_file_path, source_file_path
+):
    bw_apis = []
    for each_api_yaml in backward_yaml_path:
@@ -283,18 +346,25 @@ def generate_backward_api(backward_yaml_path, header_file_path,
 def main():
    parser = argparse.ArgumentParser(
-        description='Generate PaddlePaddle C++ backward API files')
+        description='Generate PaddlePaddle C++ backward API files'
-    parser.add_argument('--backward_yaml_path',
+    )
-                        help='path to backward yaml file',
+    parser.add_argument(
-                        nargs='+',
+        '--backward_yaml_path',
-                        default='paddle/phi/api/yaml/backward.yaml')
+        help='path to backward yaml file',
-    parser.add_argument('--backward_header_path',
+        nargs='+',
-                        help='output of generated backward header code file',
+        default='paddle/phi/api/yaml/backward.yaml',
-                        default='paddle/phi/api/backward/backward_api.h')
+    )
+    parser.add_argument(
-    parser.add_argument('--backward_source_path',
+        '--backward_header_path',
-                        help='output of generated backward source code file',
+        help='output of generated backward header code file',
-                        default='paddle/phi/api/lib/backward_api.cc')
+        default='paddle/phi/api/backward/backward_api.h',
+    )
+    parser.add_argument(
+        '--backward_source_path',
+        help='output of generated backward source code file',
+        default='paddle/phi/api/lib/backward_api.cc',
+    )
    options = parser.parse_args()
@@ -302,8 +372,9 @@ def main():
    header_file_path = options.backward_header_path
    source_file_path = options.backward_source_path
-    generate_backward_api(backward_yaml_path, header_file_path,
+    generate_backward_api(
-                          source_file_path)
+        backward_yaml_path, header_file_path, source_file_path
+    )
 if __name__ == '__main__':

--- a/paddle/phi/api/yaml/generator/cross_validate.py
+++ b/paddle/phi/api/yaml/generator/cross_validate.py
@@ -34,17 +34,22 @@ def main(forward_api_yaml_paths, backward_api_yaml_paths):
 if __name__ == "__main__":
    current_dir = Path(__file__).parent / "temp"
    parser = argparse.ArgumentParser(
-        description="Parse api yaml into canonical format.")
+        description="Parse api yaml into canonical format."
-    parser.add_argument('--forward_yaml_paths',
+    )
-                        type=str,
+    parser.add_argument(
-                        nargs='+',
+        '--forward_yaml_paths',
-                        default=str(current_dir / "api.parsed.yaml"),
+        type=str,
-                        help="forward api yaml file.")
+        nargs='+',
-    parser.add_argument('--backward_yaml_paths',
+        default=str(current_dir / "api.parsed.yaml"),
-                        type=str,
+        help="forward api yaml file.",
-                        nargs='+',
+    )
-                        default=str(current_dir / "backward_api.parsed.yaml"),
+    parser.add_argument(
-                        help="backward api yaml file.")
+        '--backward_yaml_paths',
+        type=str,
+        nargs='+',
+        default=str(current_dir / "backward_api.parsed.yaml"),
+        help="backward api yaml file.",
+    )
    args = parser.parse_args()
    main(args.forward_yaml_paths, args.backward_yaml_paths)
--- a/paddle/phi/api/yaml/generator/filters.py
+++ b/paddle/phi/api/yaml/generator/filters.py
@@ -15,12 +15,20 @@
 import itertools
 import re
-from type_mapping import (input_types_map, optional_input_types_map,
+from type_mapping import (
-                          attr_types_map, opmaker_attr_types_map,
+    input_types_map,
-                          output_type_map)
+    optional_input_types_map,
-from type_mapping import (dense_input_types_map, dense_optional_input_types_map,
+    attr_types_map,
-                          dense_output_types_map, sr_output_types_map,
+    opmaker_attr_types_map,
-                          phi_attr_types_map)
+    output_type_map,
+)
+from type_mapping import (
+    dense_input_types_map,
+    dense_optional_input_types_map,
+    dense_output_types_map,
+    sr_output_types_map,
+    phi_attr_types_map,
+)
 def quote(s):
@@ -104,7 +112,7 @@ def to_input_name(s):
    is more common.
    """
    match = re.match(r"(d\d*)(\w+)", s)
-    assert (match.group(1) != ""), "it should be a grad style name."
+    assert match.group(1) != "", "it should be a grad style name."
    return match.group(2)
@@ -117,9 +125,10 @@ def cartesian_prod_attrs(attrs):
            items.append((name, "{}Tensor".format(name)))
        elif type_name == "IntArray":
            items.append(
-                (name, "{}Tensor".format(name), "{}TensorList".format(name)))
+                (name, "{}Tensor".format(name), "{}TensorList".format(name))
+            )
        else:
-            items.append((name, ))
+            items.append((name,))
    _combinations = itertools.product(*items)
    combinations = []

--- a/paddle/phi/api/yaml/generator/generate_op.py
+++ b/paddle/phi/api/yaml/generator/generate_op.py
--- a/paddle/phi/api/yaml/generator/generate_sparse_op.py
+++ b/paddle/phi/api/yaml/generator/generate_sparse_op.py
--- a/paddle/phi/api/yaml/generator/intermediate_api_gen.py
+++ b/paddle/phi/api/yaml/generator/intermediate_api_gen.py
--- a/paddle/phi/api/yaml/generator/ops_extra_info_gen.py
+++ b/paddle/phi/api/yaml/generator/ops_extra_info_gen.py
--- a/paddle/phi/api/yaml/generator/parse_api.py
+++ b/paddle/phi/api/yaml/generator/parse_api.py
--- a/paddle/phi/api/yaml/generator/parse_utils.py
+++ b/paddle/phi/api/yaml/generator/parse_utils.py
--- a/paddle/phi/api/yaml/generator/sparse_api_gen.py
+++ b/paddle/phi/api/yaml/generator/sparse_api_gen.py
--- a/paddle/phi/api/yaml/generator/sparse_bw_api_gen.py
+++ b/paddle/phi/api/yaml/generator/sparse_bw_api_gen.py
--- a/paddle/phi/api/yaml/generator/strings_api_gen.py
+++ b/paddle/phi/api/yaml/generator/strings_api_gen.py
--- a/paddle/phi/api/yaml/generator/type_mapping.py
+++ b/paddle/phi/api/yaml/generator/type_mapping.py
--- a/paddle/phi/api/yaml/generator/wrapped_infermeta_gen.py
+++ b/paddle/phi/api/yaml/generator/wrapped_infermeta_gen.py
--- a/paddle/scripts/paddle_build.sh
+++ b/paddle/scripts/paddle_build.sh
--- a/pyproject.toml
+++ b/pyproject.toml
+[tool.black]
+exclude = "build"
+line-length = 80
+skip-string-normalization = true
--- a/python/paddle/__init__.py
+++ b/python/paddle/__init__.py
--- a/python/paddle/amp/auto_cast.py
+++ b/python/paddle/amp/auto_cast.py
--- a/python/paddle/amp/grad_scaler.py
+++ b/python/paddle/amp/grad_scaler.py
--- a/python/paddle/audio/__init__.py
+++ b/python/paddle/audio/__init__.py
--- a/python/paddle/audio/backends/backend.py
+++ b/python/paddle/audio/backends/backend.py
--- a/python/paddle/audio/backends/init_backend.py
+++ b/python/paddle/audio/backends/init_backend.py
--- a/python/paddle/audio/backends/wave_backend.py
+++ b/python/paddle/audio/backends/wave_backend.py
--- a/python/paddle/audio/datasets/dataset.py
+++ b/python/paddle/audio/datasets/dataset.py
--- a/python/paddle/audio/datasets/esc50.py
+++ b/python/paddle/audio/datasets/esc50.py
--- a/python/paddle/audio/datasets/tess.py
+++ b/python/paddle/audio/datasets/tess.py
--- a/python/paddle/audio/features/layers.py
+++ b/python/paddle/audio/features/layers.py
--- a/python/paddle/audio/functional/functional.py
+++ b/python/paddle/audio/functional/functional.py
--- a/python/paddle/audio/functional/window.py
+++ b/python/paddle/audio/functional/window.py
--- a/python/paddle/audio/utils/error.py
+++ b/python/paddle/audio/utils/error.py
--- a/python/paddle/autograd/__init__.py
+++ b/python/paddle/autograd/__init__.py
--- a/python/paddle/autograd/backward_mode.py
+++ b/python/paddle/autograd/backward_mode.py
--- a/python/paddle/autograd/py_layer.py
+++ b/python/paddle/autograd/py_layer.py
--- a/python/paddle/autograd/saved_tensors_hooks.py
+++ b/python/paddle/autograd/saved_tensors_hooks.py
--- a/python/paddle/batch.py
+++ b/python/paddle/batch.py
--- a/python/paddle/callbacks.py
+++ b/python/paddle/callbacks.py
--- a/python/paddle/check_import_scipy.py
+++ b/python/paddle/check_import_scipy.py
--- a/python/paddle/common_ops_import.py
+++ b/python/paddle/common_ops_import.py
--- a/python/paddle/cost_model/cost_model.py
+++ b/python/paddle/cost_model/cost_model.py
--- a/python/paddle/dataset/cifar.py
+++ b/python/paddle/dataset/cifar.py
--- a/python/paddle/dataset/common.py
+++ b/python/paddle/dataset/common.py
--- a/python/paddle/dataset/conll05.py
+++ b/python/paddle/dataset/conll05.py
--- a/python/paddle/dataset/flowers.py
+++ b/python/paddle/dataset/flowers.py
--- a/python/paddle/dataset/image.py
+++ b/python/paddle/dataset/image.py
--- a/python/paddle/dataset/imdb.py
+++ b/python/paddle/dataset/imdb.py
--- a/python/paddle/dataset/imikolov.py
+++ b/python/paddle/dataset/imikolov.py
--- a/python/paddle/dataset/mnist.py
+++ b/python/paddle/dataset/mnist.py
--- a/python/paddle/dataset/movielens.py
+++ b/python/paddle/dataset/movielens.py
--- a/python/paddle/dataset/tests/cifar_test.py
+++ b/python/paddle/dataset/tests/cifar_test.py
--- a/python/paddle/dataset/tests/flowers_test.py
+++ b/python/paddle/dataset/tests/flowers_test.py
--- a/python/paddle/dataset/tests/imikolov_test.py
+++ b/python/paddle/dataset/tests/imikolov_test.py
--- a/python/paddle/dataset/tests/mnist_test.py
+++ b/python/paddle/dataset/tests/mnist_test.py
--- a/python/paddle/dataset/tests/test_image.py
+++ b/python/paddle/dataset/tests/test_image.py
--- a/python/paddle/dataset/tests/voc2012_test.py
+++ b/python/paddle/dataset/tests/voc2012_test.py
--- a/python/paddle/dataset/tests/wmt16_test.py
+++ b/python/paddle/dataset/tests/wmt16_test.py
--- a/python/paddle/dataset/uci_housing.py
+++ b/python/paddle/dataset/uci_housing.py
--- a/python/paddle/dataset/voc2012.py
+++ b/python/paddle/dataset/voc2012.py
--- a/python/paddle/dataset/wmt14.py
+++ b/python/paddle/dataset/wmt14.py
--- a/python/paddle/dataset/wmt16.py
+++ b/python/paddle/dataset/wmt16.py
--- a/python/paddle/device/__init__.py
+++ b/python/paddle/device/__init__.py
--- a/python/paddle/device/cuda/__init__.py
+++ b/python/paddle/device/cuda/__init__.py
--- a/python/paddle/device/cuda/graphs.py
+++ b/python/paddle/device/cuda/graphs.py
--- a/python/paddle/distributed/__init__.py
+++ b/python/paddle/distributed/__init__.py
--- a/python/paddle/distributed/auto_parallel/callbacks.py
+++ b/python/paddle/distributed/auto_parallel/callbacks.py
--- a/python/paddle/distributed/auto_parallel/cluster.py
+++ b/python/paddle/distributed/auto_parallel/cluster.py
--- a/python/paddle/distributed/auto_parallel/cluster_v2.py
+++ b/python/paddle/distributed/auto_parallel/cluster_v2.py
--- a/python/paddle/distributed/auto_parallel/completion.py
+++ b/python/paddle/distributed/auto_parallel/completion.py
--- a/python/paddle/distributed/auto_parallel/converter.py
+++ b/python/paddle/distributed/auto_parallel/converter.py
--- a/python/paddle/distributed/auto_parallel/cost/base_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/base_cost.py
--- a/python/paddle/distributed/auto_parallel/cost/comm_op_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/comm_op_cost.py
--- a/python/paddle/distributed/auto_parallel/cost/comp_op_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/comp_op_cost.py
--- a/python/paddle/distributed/auto_parallel/cost/estimate_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/estimate_cost.py
--- a/python/paddle/distributed/auto_parallel/cost/tensor_cost.py
+++ b/python/paddle/distributed/auto_parallel/cost/tensor_cost.py
--- a/python/paddle/distributed/auto_parallel/cost_model.py
+++ b/python/paddle/distributed/auto_parallel/cost_model.py
--- a/python/paddle/distributed/auto_parallel/dist_attribute.py
+++ b/python/paddle/distributed/auto_parallel/dist_attribute.py
--- a/python/paddle/distributed/auto_parallel/dist_context.py
+++ b/python/paddle/distributed/auto_parallel/dist_context.py
--- a/python/paddle/distributed/auto_parallel/dist_loader.py
+++ b/python/paddle/distributed/auto_parallel/dist_loader.py
--- a/python/paddle/distributed/auto_parallel/dist_op.py
+++ b/python/paddle/distributed/auto_parallel/dist_op.py
--- a/python/paddle/distributed/auto_parallel/dist_saver.py
+++ b/python/paddle/distributed/auto_parallel/dist_saver.py
--- a/python/paddle/distributed/auto_parallel/dist_tensor.py
+++ b/python/paddle/distributed/auto_parallel/dist_tensor.py
--- a/python/paddle/distributed/auto_parallel/engine.py
+++ b/python/paddle/distributed/auto_parallel/engine.py
--- a/python/paddle/distributed/auto_parallel/graph.py
+++ b/python/paddle/distributed/auto_parallel/graph.py
--- a/python/paddle/distributed/auto_parallel/helper.py
+++ b/python/paddle/distributed/auto_parallel/helper.py
--- a/python/paddle/distributed/auto_parallel/interface.py
+++ b/python/paddle/distributed/auto_parallel/interface.py
--- a/python/paddle/distributed/auto_parallel/mapper.py
+++ b/python/paddle/distributed/auto_parallel/mapper.py
--- a/python/paddle/distributed/auto_parallel/operators/common.py
+++ b/python/paddle/distributed/auto_parallel/operators/common.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_assign.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_assign.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_check_finite_and_unscale.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_check_finite_and_unscale.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_default.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_default.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_eltwise.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_eltwise.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_embedding.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_embedding.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_fill_constant_batch_size_like.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_fill_constant_batch_size_like.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_fused_attention.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_fused_attention.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_fused_feedforward.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_fused_feedforward.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_matmul.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_matmul.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_pnorm.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_pnorm.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_reduce_sum_p.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_reduce_sum_p.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_reshape.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_reshape.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_shape.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_shape.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_slice.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_slice.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_softmax.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_softmax.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_split.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_split.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_transpose.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_transpose.py
--- a/python/paddle/distributed/auto_parallel/operators/dist_update_loss_scaling.py
+++ b/python/paddle/distributed/auto_parallel/operators/dist_update_loss_scaling.py
--- a/python/paddle/distributed/auto_parallel/parallelizer.py
+++ b/python/paddle/distributed/auto_parallel/parallelizer.py
--- a/python/paddle/distributed/auto_parallel/parallelizer_v2.py
+++ b/python/paddle/distributed/auto_parallel/parallelizer_v2.py
--- a/python/paddle/distributed/auto_parallel/partitioner.py
+++ b/python/paddle/distributed/auto_parallel/partitioner.py
--- a/python/paddle/distributed/auto_parallel/planner.py
+++ b/python/paddle/distributed/auto_parallel/planner.py
--- a/python/paddle/distributed/auto_parallel/planner_v2.py
+++ b/python/paddle/distributed/auto_parallel/planner_v2.py
--- a/python/paddle/distributed/auto_parallel/process_group.py
+++ b/python/paddle/distributed/auto_parallel/process_group.py
--- a/python/paddle/distributed/auto_parallel/process_mesh.py
+++ b/python/paddle/distributed/auto_parallel/process_mesh.py
--- a/python/paddle/distributed/auto_parallel/process_mesh_v2.py
+++ b/python/paddle/distributed/auto_parallel/process_mesh_v2.py
--- a/python/paddle/distributed/auto_parallel/reshard.py
+++ b/python/paddle/distributed/auto_parallel/reshard.py
--- a/python/paddle/distributed/auto_parallel/strategy.py
+++ b/python/paddle/distributed/auto_parallel/strategy.py
--- a/python/paddle/distributed/auto_parallel/tuner/algorithms.py
+++ b/python/paddle/distributed/auto_parallel/tuner/algorithms.py
--- a/python/paddle/distributed/auto_parallel/tuner/config.py
+++ b/python/paddle/distributed/auto_parallel/tuner/config.py
--- a/python/paddle/distributed/auto_parallel/tuner/optimization_tuner.py
+++ b/python/paddle/distributed/auto_parallel/tuner/optimization_tuner.py
--- a/python/paddle/distributed/auto_parallel/tuner/parallel_tuner.py
+++ b/python/paddle/distributed/auto_parallel/tuner/parallel_tuner.py
--- a/python/paddle/distributed/auto_parallel/tuner/profiler.py
+++ b/python/paddle/distributed/auto_parallel/tuner/profiler.py
--- a/python/paddle/distributed/auto_parallel/tuner/recorder.py
+++ b/python/paddle/distributed/auto_parallel/tuner/recorder.py
--- a/python/paddle/distributed/auto_parallel/tuner/storable.py
+++ b/python/paddle/distributed/auto_parallel/tuner/storable.py
--- a/python/paddle/distributed/auto_parallel/tuner/trial.py
+++ b/python/paddle/distributed/auto_parallel/tuner/trial.py
--- a/python/paddle/distributed/auto_parallel/tuner/tunable_space.py
+++ b/python/paddle/distributed/auto_parallel/tuner/tunable_space.py
--- a/python/paddle/distributed/auto_parallel/tuner/tunable_variable.py
+++ b/python/paddle/distributed/auto_parallel/tuner/tunable_variable.py
--- a/python/paddle/distributed/auto_parallel/utils.py
+++ b/python/paddle/distributed/auto_parallel/utils.py
--- a/python/paddle/distributed/cloud_utils.py
+++ b/python/paddle/distributed/cloud_utils.py
--- a/python/paddle/distributed/collective.py
+++ b/python/paddle/distributed/collective.py
--- a/python/paddle/distributed/communication/all_reduce.py
+++ b/python/paddle/distributed/communication/all_reduce.py
--- a/python/paddle/distributed/communication/group.py
+++ b/python/paddle/distributed/communication/group.py
--- a/python/paddle/distributed/communication/reduce.py
+++ b/python/paddle/distributed/communication/reduce.py
--- a/python/paddle/distributed/communication/stream/__init__.py
+++ b/python/paddle/distributed/communication/stream/__init__.py
--- a/python/paddle/distributed/communication/stream/all_gather.py
+++ b/python/paddle/distributed/communication/stream/all_gather.py
--- a/python/paddle/distributed/communication/stream/all_reduce.py
+++ b/python/paddle/distributed/communication/stream/all_reduce.py
--- a/python/paddle/distributed/communication/stream/alltoall.py
+++ b/python/paddle/distributed/communication/stream/alltoall.py
--- a/python/paddle/distributed/communication/stream/alltoall_single.py
+++ b/python/paddle/distributed/communication/stream/alltoall_single.py
--- a/python/paddle/distributed/communication/stream/broadcast.py
+++ b/python/paddle/distributed/communication/stream/broadcast.py
--- a/python/paddle/distributed/communication/stream/recv.py
+++ b/python/paddle/distributed/communication/stream/recv.py
--- a/python/paddle/distributed/communication/stream/reduce.py
+++ b/python/paddle/distributed/communication/stream/reduce.py
--- a/python/paddle/distributed/communication/stream/reduce_scatter.py
+++ b/python/paddle/distributed/communication/stream/reduce_scatter.py
--- a/python/paddle/distributed/communication/stream/scatter.py
+++ b/python/paddle/distributed/communication/stream/scatter.py
--- a/python/paddle/distributed/communication/stream/send.py
+++ b/python/paddle/distributed/communication/stream/send.py
--- a/python/paddle/distributed/elastic.py
+++ b/python/paddle/distributed/elastic.py
--- a/python/paddle/distributed/entry_attr.py
+++ b/python/paddle/distributed/entry_attr.py
--- a/python/paddle/distributed/fleet/__init__.py
+++ b/python/paddle/distributed/fleet/__init__.py
--- a/python/paddle/distributed/fleet/ascend_utils.py
+++ b/python/paddle/distributed/fleet/ascend_utils.py
--- a/python/paddle/distributed/fleet/base/distributed_strategy.py
+++ b/python/paddle/distributed/fleet/base/distributed_strategy.py
--- a/python/paddle/distributed/fleet/base/meta_optimizer_factory.py
+++ b/python/paddle/distributed/fleet/base/meta_optimizer_factory.py
--- a/python/paddle/distributed/fleet/base/orthogonal_strategy.py
+++ b/python/paddle/distributed/fleet/base/orthogonal_strategy.py
--- a/python/paddle/distributed/fleet/base/private_helper_function.py
+++ b/python/paddle/distributed/fleet/base/private_helper_function.py
--- a/python/paddle/distributed/fleet/base/role_maker.py
+++ b/python/paddle/distributed/fleet/base/role_maker.py
--- a/python/paddle/distributed/fleet/base/runtime_factory.py
+++ b/python/paddle/distributed/fleet/base/runtime_factory.py
--- a/python/paddle/distributed/fleet/base/strategy_compiler.py
+++ b/python/paddle/distributed/fleet/base/strategy_compiler.py
--- a/python/paddle/distributed/fleet/base/strategy_group.py
+++ b/python/paddle/distributed/fleet/base/strategy_group.py
--- a/python/paddle/distributed/fleet/base/topology.py
+++ b/python/paddle/distributed/fleet/base/topology.py
--- a/python/paddle/distributed/fleet/base/util_factory.py
+++ b/python/paddle/distributed/fleet/base/util_factory.py
--- a/python/paddle/distributed/fleet/cloud_utils.py
+++ b/python/paddle/distributed/fleet/cloud_utils.py
--- a/python/paddle/distributed/fleet/data_generator/data_generator.py
+++ b/python/paddle/distributed/fleet/data_generator/data_generator.py
--- a/python/paddle/distributed/fleet/dataset/dataset.py
+++ b/python/paddle/distributed/fleet/dataset/dataset.py
--- a/python/paddle/distributed/fleet/dataset/index_dataset.py
+++ b/python/paddle/distributed/fleet/dataset/index_dataset.py
--- a/python/paddle/distributed/fleet/elastic/__init__.py
+++ b/python/paddle/distributed/fleet/elastic/__init__.py
--- a/python/paddle/distributed/fleet/elastic/collective.py
+++ b/python/paddle/distributed/fleet/elastic/collective.py
--- a/python/paddle/distributed/fleet/elastic/manager.py
+++ b/python/paddle/distributed/fleet/elastic/manager.py
--- a/python/paddle/distributed/fleet/fleet.py
+++ b/python/paddle/distributed/fleet/fleet.py
--- a/python/paddle/distributed/fleet/fleet_executor_utils.py
+++ b/python/paddle/distributed/fleet/fleet_executor_utils.py
--- a/python/paddle/distributed/fleet/launch.py
+++ b/python/paddle/distributed/fleet/launch.py
--- a/python/paddle/distributed/fleet/launch_utils.py
+++ b/python/paddle/distributed/fleet/launch_utils.py
--- a/python/paddle/distributed/fleet/layers/mpu/mp_layers.py
+++ b/python/paddle/distributed/fleet/layers/mpu/mp_layers.py
--- a/python/paddle/distributed/fleet/layers/mpu/mp_ops.py
+++ b/python/paddle/distributed/fleet/layers/mpu/mp_ops.py
--- a/python/paddle/distributed/fleet/layers/mpu/random.py
+++ b/python/paddle/distributed/fleet/layers/mpu/random.py
--- a/python/paddle/distributed/fleet/meta_optimizers/amp_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/amp_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_parser.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/ascend/ascend_parser.py
--- a/python/paddle/distributed/fleet/meta_optimizers/asp_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/asp_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/common.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/common.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dgc_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dgc_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/dygraph_sharding_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/dygraph_sharding_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/heter_parallel_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/heter_parallel_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_gradscaler.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_gradscaler.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/hybrid_parallel_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/sharding_optimizer_stage2.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/dygraph_optimizer/sharding_optimizer_stage2.py
--- a/python/paddle/distributed/fleet/meta_optimizers/fp16_allreduce_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/fp16_allreduce_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/gradient_merge_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/gradient_merge_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/graph_execution_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/graph_execution_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/lamb_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/lamb_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/lars_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/lars_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/localsgd_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/localsgd_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/meta_optimizer_base.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/meta_optimizer_base.py
--- a/python/paddle/distributed/fleet/meta_optimizers/parameter_server_graph_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/parameter_server_graph_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/parameter_server_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/parameter_server_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/pipeline_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/pipeline_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/ps_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/ps_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/raw_program_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/raw_program_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/recompute_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/recompute_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/fp16_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/fp16_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/gradient_clip_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/gradient_clip_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/offload_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/offload_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/prune.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/prune.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/shard.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/shard.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/utils.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/utils.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding/weight_decay_helper.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding/weight_decay_helper.py
--- a/python/paddle/distributed/fleet/meta_optimizers/sharding_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/sharding_optimizer.py
--- a/python/paddle/distributed/fleet/meta_optimizers/tensor_parallel_optimizer.py
+++ b/python/paddle/distributed/fleet/meta_optimizers/tensor_parallel_optimizer.py
--- a/python/paddle/distributed/fleet/meta_parallel/meta_parallel_base.py
+++ b/python/paddle/distributed/fleet/meta_parallel/meta_parallel_base.py
--- a/python/paddle/distributed/fleet/meta_parallel/parallel_layers/pp_layers.py
+++ b/python/paddle/distributed/fleet/meta_parallel/parallel_layers/pp_layers.py
--- a/python/paddle/distributed/fleet/meta_parallel/pipeline_parallel.py
+++ b/python/paddle/distributed/fleet/meta_parallel/pipeline_parallel.py
--- a/python/paddle/distributed/fleet/meta_parallel/pp_utils/p2p_communication.py
+++ b/python/paddle/distributed/fleet/meta_parallel/pp_utils/p2p_communication.py
--- a/python/paddle/distributed/fleet/meta_parallel/pp_utils/utils.py
+++ b/python/paddle/distributed/fleet/meta_parallel/pp_utils/utils.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_optimizer_stage2.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_optimizer_stage2.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage2.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage2.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage3.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage3.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_storage.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_storage.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_utils.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_utils.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage2.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage2.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage3.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_stage3.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_utils.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding/sharding_utils.py
--- a/python/paddle/distributed/fleet/meta_parallel/sharding_parallel.py
+++ b/python/paddle/distributed/fleet/meta_parallel/sharding_parallel.py
--- a/python/paddle/distributed/fleet/meta_parallel/tensor_parallel.py
+++ b/python/paddle/distributed/fleet/meta_parallel/tensor_parallel.py
--- a/python/paddle/distributed/fleet/metrics/metric.py
+++ b/python/paddle/distributed/fleet/metrics/metric.py
--- a/python/paddle/distributed/fleet/model.py
+++ b/python/paddle/distributed/fleet/model.py
--- a/python/paddle/distributed/fleet/optimizer.py
+++ b/python/paddle/distributed/fleet/optimizer.py
--- a/python/paddle/distributed/fleet/recompute/recompute.py
+++ b/python/paddle/distributed/fleet/recompute/recompute.py
--- a/python/paddle/distributed/fleet/recompute/recompute_hybrid.py
+++ b/python/paddle/distributed/fleet/recompute/recompute_hybrid.py
--- a/python/paddle/distributed/fleet/runtime/collective_runtime.py
+++ b/python/paddle/distributed/fleet/runtime/collective_runtime.py
--- a/python/paddle/distributed/fleet/runtime/parameter_server_runtime.py
+++ b/python/paddle/distributed/fleet/runtime/parameter_server_runtime.py
--- a/python/paddle/distributed/fleet/runtime/runtime_base.py
+++ b/python/paddle/distributed/fleet/runtime/runtime_base.py
--- a/python/paddle/distributed/fleet/runtime/the_one_ps.py
+++ b/python/paddle/distributed/fleet/runtime/the_one_ps.py
--- a/python/paddle/distributed/fleet/scaler.py
+++ b/python/paddle/distributed/fleet/scaler.py
--- a/python/paddle/distributed/fleet/utils/__init__.py
+++ b/python/paddle/distributed/fleet/utils/__init__.py
--- a/python/paddle/distributed/fleet/utils/fs.py
+++ b/python/paddle/distributed/fleet/utils/fs.py
--- a/python/paddle/distributed/fleet/utils/http_server.py
+++ b/python/paddle/distributed/fleet/utils/http_server.py
--- a/python/paddle/distributed/fleet/utils/hybrid_parallel_inference.py
+++ b/python/paddle/distributed/fleet/utils/hybrid_parallel_inference.py
--- a/python/paddle/distributed/fleet/utils/hybrid_parallel_util.py
+++ b/python/paddle/distributed/fleet/utils/hybrid_parallel_util.py
--- a/python/paddle/distributed/fleet/utils/internal_storage.py
+++ b/python/paddle/distributed/fleet/utils/internal_storage.py
--- a/python/paddle/distributed/fleet/utils/log_util.py
+++ b/python/paddle/distributed/fleet/utils/log_util.py
--- a/python/paddle/distributed/fleet/utils/ps_util.py
+++ b/python/paddle/distributed/fleet/utils/ps_util.py
--- a/python/paddle/distributed/launch/context/__init__.py
+++ b/python/paddle/distributed/launch/context/__init__.py
--- a/python/paddle/distributed/launch/context/args_envs.py
+++ b/python/paddle/distributed/launch/context/args_envs.py
--- a/python/paddle/distributed/launch/context/device.py
+++ b/python/paddle/distributed/launch/context/device.py
--- a/python/paddle/distributed/launch/context/event.py
+++ b/python/paddle/distributed/launch/context/event.py
--- a/python/paddle/distributed/launch/context/node.py
+++ b/python/paddle/distributed/launch/context/node.py
--- a/python/paddle/distributed/launch/context/resource.py
+++ b/python/paddle/distributed/launch/context/resource.py
--- a/python/paddle/distributed/launch/controllers/collective.py
+++ b/python/paddle/distributed/launch/controllers/collective.py
--- a/python/paddle/distributed/launch/controllers/controller.py
+++ b/python/paddle/distributed/launch/controllers/controller.py
--- a/python/paddle/distributed/launch/controllers/ipu_controller.py
+++ b/python/paddle/distributed/launch/controllers/ipu_controller.py
--- a/python/paddle/distributed/launch/controllers/master.py
+++ b/python/paddle/distributed/launch/controllers/master.py
--- a/python/paddle/distributed/launch/controllers/ps.py
+++ b/python/paddle/distributed/launch/controllers/ps.py
--- a/python/paddle/distributed/launch/controllers/rpc.py
+++ b/python/paddle/distributed/launch/controllers/rpc.py
--- a/python/paddle/distributed/launch/controllers/watcher.py
+++ b/python/paddle/distributed/launch/controllers/watcher.py
--- a/python/paddle/distributed/launch/job/container.py
+++ b/python/paddle/distributed/launch/job/container.py
--- a/python/paddle/distributed/launch/job/job.py
+++ b/python/paddle/distributed/launch/job/job.py
--- a/python/paddle/distributed/launch/job/pod.py
+++ b/python/paddle/distributed/launch/job/pod.py
--- a/python/paddle/distributed/launch/main.py
+++ b/python/paddle/distributed/launch/main.py
--- a/python/paddle/distributed/launch/plugins/__init__.py
+++ b/python/paddle/distributed/launch/plugins/__init__.py
--- a/python/paddle/distributed/launch/plugins/test.py
+++ b/python/paddle/distributed/launch/plugins/test.py
--- a/python/paddle/distributed/launch/utils/kv_client.py
+++ b/python/paddle/distributed/launch/utils/kv_client.py
--- a/python/paddle/distributed/launch/utils/kv_server.py
+++ b/python/paddle/distributed/launch/utils/kv_server.py
--- a/python/paddle/distributed/launch/utils/nvsmi.py
+++ b/python/paddle/distributed/launch/utils/nvsmi.py
--- a/python/paddle/distributed/launch/utils/process_context.py
+++ b/python/paddle/distributed/launch/utils/process_context.py
--- a/python/paddle/distributed/metric/metrics.py
+++ b/python/paddle/distributed/metric/metrics.py
--- a/python/paddle/distributed/models/moe/utils.py
+++ b/python/paddle/distributed/models/moe/utils.py
--- a/python/paddle/distributed/parallel.py
+++ b/python/paddle/distributed/parallel.py
--- a/python/paddle/distributed/parallel_with_gloo.py
+++ b/python/paddle/distributed/parallel_with_gloo.py
--- a/python/paddle/distributed/passes/auto_parallel_amp.py
+++ b/python/paddle/distributed/passes/auto_parallel_amp.py
--- a/python/paddle/distributed/passes/auto_parallel_data_parallel_optimization.py
+++ b/python/paddle/distributed/passes/auto_parallel_data_parallel_optimization.py
--- a/python/paddle/distributed/passes/auto_parallel_fp16.py
+++ b/python/paddle/distributed/passes/auto_parallel_fp16.py
--- a/python/paddle/distributed/passes/auto_parallel_grad_clip.py
+++ b/python/paddle/distributed/passes/auto_parallel_grad_clip.py
--- a/python/paddle/distributed/passes/auto_parallel_gradient_merge.py
+++ b/python/paddle/distributed/passes/auto_parallel_gradient_merge.py
--- a/python/paddle/distributed/passes/auto_parallel_quantization.py
+++ b/python/paddle/distributed/passes/auto_parallel_quantization.py
--- a/python/paddle/distributed/passes/auto_parallel_recompute.py
+++ b/python/paddle/distributed/passes/auto_parallel_recompute.py
--- a/python/paddle/distributed/passes/auto_parallel_sharding.py
+++ b/python/paddle/distributed/passes/auto_parallel_sharding.py
--- a/python/paddle/distributed/passes/cpp_pass.py
+++ b/python/paddle/distributed/passes/cpp_pass.py
--- a/python/paddle/distributed/passes/fuse_all_reduce.py
+++ b/python/paddle/distributed/passes/fuse_all_reduce.py
--- a/python/paddle/distributed/passes/pass_base.py
+++ b/python/paddle/distributed/passes/pass_base.py
--- a/python/paddle/distributed/passes/pass_utils.py
+++ b/python/paddle/distributed/passes/pass_utils.py
--- a/python/paddle/distributed/passes/ps_server_pass.py
+++ b/python/paddle/distributed/passes/ps_server_pass.py
--- a/python/paddle/distributed/passes/ps_trainer_pass.py
+++ b/python/paddle/distributed/passes/ps_trainer_pass.py
--- a/python/paddle/distributed/ps/coordinator.py
+++ b/python/paddle/distributed/ps/coordinator.py
--- a/python/paddle/distributed/ps/the_one_ps.py
+++ b/python/paddle/distributed/ps/the_one_ps.py
--- a/python/paddle/distributed/ps/utils/ps_factory.py
+++ b/python/paddle/distributed/ps/utils/ps_factory.py
--- a/python/paddle/distributed/ps/utils/public.py
+++ b/python/paddle/distributed/ps/utils/public.py
--- a/python/paddle/distributed/rpc/rpc.py
+++ b/python/paddle/distributed/rpc/rpc.py
--- a/python/paddle/distributed/sharding/__init__.py
+++ b/python/paddle/distributed/sharding/__init__.py
--- a/python/paddle/distributed/sharding/group_sharded.py
+++ b/python/paddle/distributed/sharding/group_sharded.py
--- a/python/paddle/distributed/spawn.py
+++ b/python/paddle/distributed/spawn.py
--- a/python/paddle/distributed/utils/launch_utils.py
+++ b/python/paddle/distributed/utils/launch_utils.py
--- a/python/paddle/distributed/utils/moe_utils.py
+++ b/python/paddle/distributed/utils/moe_utils.py
--- a/python/paddle/distribution/__init__.py
+++ b/python/paddle/distribution/__init__.py
--- a/python/paddle/distribution/beta.py
+++ b/python/paddle/distribution/beta.py
--- a/python/paddle/distribution/categorical.py
+++ b/python/paddle/distribution/categorical.py
--- a/python/paddle/distribution/constraint.py
+++ b/python/paddle/distribution/constraint.py
--- a/python/paddle/distribution/dirichlet.py
+++ b/python/paddle/distribution/dirichlet.py
--- a/python/paddle/distribution/distribution.py
+++ b/python/paddle/distribution/distribution.py
--- a/python/paddle/distribution/exponential_family.py
+++ b/python/paddle/distribution/exponential_family.py
--- a/python/paddle/distribution/gumbel.py
+++ b/python/paddle/distribution/gumbel.py
--- a/python/paddle/distribution/independent.py
+++ b/python/paddle/distribution/independent.py
--- a/python/paddle/distribution/kl.py
+++ b/python/paddle/distribution/kl.py
--- a/python/paddle/distribution/laplace.py
+++ b/python/paddle/distribution/laplace.py
--- a/python/paddle/distribution/lognormal.py
+++ b/python/paddle/distribution/lognormal.py
--- a/python/paddle/distribution/multinomial.py
+++ b/python/paddle/distribution/multinomial.py
--- a/python/paddle/distribution/normal.py
+++ b/python/paddle/distribution/normal.py
--- a/python/paddle/distribution/transform.py
+++ b/python/paddle/distribution/transform.py
--- a/python/paddle/distribution/transformed_distribution.py
+++ b/python/paddle/distribution/transformed_distribution.py
--- a/python/paddle/distribution/uniform.py
+++ b/python/paddle/distribution/uniform.py
--- a/python/paddle/distribution/variable.py
+++ b/python/paddle/distribution/variable.py
--- a/python/paddle/fft.py
+++ b/python/paddle/fft.py
--- a/python/paddle/fluid/__init__.py
+++ b/python/paddle/fluid/__init__.py
--- a/python/paddle/fluid/average.py
+++ b/python/paddle/fluid/average.py
--- a/python/paddle/fluid/backward.py
+++ b/python/paddle/fluid/backward.py
--- a/python/paddle/fluid/clip.py
+++ b/python/paddle/fluid/clip.py
--- a/python/paddle/fluid/communicator.py
+++ b/python/paddle/fluid/communicator.py
--- a/python/paddle/fluid/compiler.py
+++ b/python/paddle/fluid/compiler.py
--- a/python/paddle/fluid/contrib/decoder/beam_search_decoder.py
+++ b/python/paddle/fluid/contrib/decoder/beam_search_decoder.py
--- a/python/paddle/fluid/contrib/extend_optimizer/extend_optimizer_with_weight_decay.py
+++ b/python/paddle/fluid/contrib/extend_optimizer/extend_optimizer_with_weight_decay.py
--- a/python/paddle/fluid/contrib/layers/metric_op.py
+++ b/python/paddle/fluid/contrib/layers/metric_op.py
--- a/python/paddle/fluid/contrib/layers/nn.py
+++ b/python/paddle/fluid/contrib/layers/nn.py
--- a/python/paddle/fluid/contrib/layers/rnn_impl.py
+++ b/python/paddle/fluid/contrib/layers/rnn_impl.py
--- a/python/paddle/fluid/contrib/memory_usage_calc.py
+++ b/python/paddle/fluid/contrib/memory_usage_calc.py
--- a/python/paddle/fluid/contrib/mixed_precision/amp_nn.py
+++ b/python/paddle/fluid/contrib/mixed_precision/amp_nn.py
--- a/python/paddle/fluid/contrib/mixed_precision/bf16/amp_lists.py
+++ b/python/paddle/fluid/contrib/mixed_precision/bf16/amp_lists.py
--- a/python/paddle/fluid/contrib/mixed_precision/bf16/amp_utils.py
+++ b/python/paddle/fluid/contrib/mixed_precision/bf16/amp_utils.py
--- a/python/paddle/fluid/contrib/mixed_precision/bf16/decorator.py
+++ b/python/paddle/fluid/contrib/mixed_precision/bf16/decorator.py
--- a/python/paddle/fluid/contrib/mixed_precision/decorator.py
+++ b/python/paddle/fluid/contrib/mixed_precision/decorator.py
--- a/python/paddle/fluid/contrib/mixed_precision/fp16_lists.py
+++ b/python/paddle/fluid/contrib/mixed_precision/fp16_lists.py
--- a/python/paddle/fluid/contrib/mixed_precision/fp16_utils.py
+++ b/python/paddle/fluid/contrib/mixed_precision/fp16_utils.py
--- a/python/paddle/fluid/contrib/model_stat.py
+++ b/python/paddle/fluid/contrib/model_stat.py
--- a/python/paddle/fluid/contrib/op_frequence.py
+++ b/python/paddle/fluid/contrib/op_frequence.py
--- a/python/paddle/fluid/contrib/optimizer.py
+++ b/python/paddle/fluid/contrib/optimizer.py
--- a/python/paddle/fluid/contrib/quantize/quantize_transpiler.py
+++ b/python/paddle/fluid/contrib/quantize/quantize_transpiler.py
--- a/python/paddle/fluid/contrib/slim/quantization/adaround.py
+++ b/python/paddle/fluid/contrib/slim/quantization/adaround.py
--- a/python/paddle/fluid/contrib/slim/quantization/cal_kl_threshold.py
+++ b/python/paddle/fluid/contrib/slim/quantization/cal_kl_threshold.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/fuse_utils.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/fuse_utils.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/ptq.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/ptq.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_hooks.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_hooks.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_quantizer.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_quantizer.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_registry.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/ptq_registry.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/qat.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/qat.py
--- a/python/paddle/fluid/contrib/slim/quantization/imperative/utils.py
+++ b/python/paddle/fluid/contrib/slim/quantization/imperative/utils.py
--- a/python/paddle/fluid/contrib/slim/quantization/post_training_quantization.py
+++ b/python/paddle/fluid/contrib/slim/quantization/post_training_quantization.py
--- a/python/paddle/fluid/contrib/slim/quantization/quant2_int8_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quant2_int8_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/quantization/quant_int8_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quant_int8_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/quantization/quantization_pass.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quantization_pass.py
--- a/python/paddle/fluid/contrib/slim/quantization/quantize_transpiler_v2.py
+++ b/python/paddle/fluid/contrib/slim/quantization/quantize_transpiler_v2.py
--- a/python/paddle/fluid/contrib/slim/quantization/utils.py
+++ b/python/paddle/fluid/contrib/slim/quantization/utils.py
--- a/python/paddle/fluid/contrib/slim/tests/convert_model2dot.py
+++ b/python/paddle/fluid/contrib/slim/tests/convert_model2dot.py
--- a/python/paddle/fluid/contrib/slim/tests/imperative_test_utils.py
+++ b/python/paddle/fluid/contrib/slim/tests/imperative_test_utils.py
--- a/python/paddle/fluid/contrib/slim/tests/quant2_int8_image_classification_comparison.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant2_int8_image_classification_comparison.py
--- a/python/paddle/fluid/contrib/slim/tests/quant2_int8_lstm_model.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant2_int8_lstm_model.py
--- a/python/paddle/fluid/contrib/slim/tests/quant2_int8_nlp_comparison.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant2_int8_nlp_comparison.py
--- a/python/paddle/fluid/contrib/slim/tests/quant_int8_image_classification_comparison.py
+++ b/python/paddle/fluid/contrib/slim/tests/quant_int8_image_classification_comparison.py
--- a/python/paddle/fluid/contrib/slim/tests/save_quant_model.py
+++ b/python/paddle/fluid/contrib/slim/tests/save_quant_model.py
--- a/python/paddle/fluid/contrib/slim/tests/test_graph.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_graph.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_out_scale.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_out_scale.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_ptq.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_ptq.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_amp.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_amp.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_channelwise.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_channelwise.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_fuse.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_fuse.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_lsq.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_lsq.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_user_defined.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_qat_user_defined.py
--- a/python/paddle/fluid/contrib/slim/tests/test_imperative_skip_op.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_imperative_skip_op.py
--- a/python/paddle/fluid/contrib/slim/tests/test_moving_average_abs_max_scale_op.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_moving_average_abs_max_scale_op.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_lstm_model.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_lstm_model.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mnist.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mnist.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mobilenetv1.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_mobilenetv1.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_program_resnet50.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_program_resnet50.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_resnet50.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_resnet50.py
--- a/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_while.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_post_training_quantization_while.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quant2_int8_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quant2_int8_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantization_mkldnn_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantization_mkldnn_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantization_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantization_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantization_scale_pass.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantization_scale_pass.py
--- a/python/paddle/fluid/contrib/slim/tests/test_quantize_transpiler_v2.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_quantize_transpiler_v2.py
--- a/python/paddle/fluid/contrib/slim/tests/test_user_defined_quantization.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_user_defined_quantization.py
--- a/python/paddle/fluid/contrib/slim/tests/test_weight_quantization_mobilenetv1.py
+++ b/python/paddle/fluid/contrib/slim/tests/test_weight_quantization_mobilenetv1.py
--- a/python/paddle/fluid/contrib/sparsity/__init__.py
+++ b/python/paddle/fluid/contrib/sparsity/__init__.py
--- a/python/paddle/fluid/contrib/sparsity/asp.py
+++ b/python/paddle/fluid/contrib/sparsity/asp.py
--- a/python/paddle/fluid/contrib/sparsity/supported_layer_list.py
+++ b/python/paddle/fluid/contrib/sparsity/supported_layer_list.py
--- a/python/paddle/fluid/contrib/sparsity/utils.py
+++ b/python/paddle/fluid/contrib/sparsity/utils.py
--- a/python/paddle/fluid/contrib/tests/test_amp_list.py
+++ b/python/paddle/fluid/contrib/tests/test_amp_list.py
--- a/python/paddle/fluid/contrib/tests/test_bf16_utils.py
+++ b/python/paddle/fluid/contrib/tests/test_bf16_utils.py
--- a/python/paddle/fluid/contrib/tests/test_correlation.py
+++ b/python/paddle/fluid/contrib/tests/test_correlation.py
--- a/python/paddle/fluid/contrib/tests/test_fp16_utils.py
+++ b/python/paddle/fluid/contrib/tests/test_fp16_utils.py
--- a/python/paddle/fluid/contrib/tests/test_image_classification_fp16.py
+++ b/python/paddle/fluid/contrib/tests/test_image_classification_fp16.py
--- a/python/paddle/fluid/contrib/tests/test_model_cast_to_bf16.py
+++ b/python/paddle/fluid/contrib/tests/test_model_cast_to_bf16.py
--- a/python/paddle/fluid/contrib/tests/test_multi_precision_fp16_train.py
+++ b/python/paddle/fluid/contrib/tests/test_multi_precision_fp16_train.py
--- a/python/paddle/fluid/contrib/tests/test_quantize_transpiler.py
+++ b/python/paddle/fluid/contrib/tests/test_quantize_transpiler.py
--- a/python/paddle/fluid/contrib/tests/test_weight_decay_extend.py
+++ b/python/paddle/fluid/contrib/tests/test_weight_decay_extend.py
--- a/python/paddle/fluid/core.py
+++ b/python/paddle/fluid/core.py
--- a/python/paddle/fluid/data.py
+++ b/python/paddle/fluid/data.py
--- a/python/paddle/fluid/data_feed_desc.py
+++ b/python/paddle/fluid/data_feed_desc.py
--- a/python/paddle/fluid/data_feeder.py
+++ b/python/paddle/fluid/data_feeder.py
--- a/python/paddle/fluid/dataloader/__init__.py
+++ b/python/paddle/fluid/dataloader/__init__.py
--- a/python/paddle/fluid/dataloader/batch_sampler.py
+++ b/python/paddle/fluid/dataloader/batch_sampler.py
--- a/python/paddle/fluid/dataloader/collate.py
+++ b/python/paddle/fluid/dataloader/collate.py
--- a/python/paddle/fluid/dataloader/dataloader_iter.py
+++ b/python/paddle/fluid/dataloader/dataloader_iter.py
--- a/python/paddle/fluid/dataloader/dataset.py
+++ b/python/paddle/fluid/dataloader/dataset.py
--- a/python/paddle/fluid/dataloader/fetcher.py
+++ b/python/paddle/fluid/dataloader/fetcher.py
--- a/python/paddle/fluid/dataloader/flat.py
+++ b/python/paddle/fluid/dataloader/flat.py
--- a/python/paddle/fluid/dataloader/sampler.py
+++ b/python/paddle/fluid/dataloader/sampler.py
--- a/python/paddle/fluid/dataloader/worker.py
+++ b/python/paddle/fluid/dataloader/worker.py
--- a/python/paddle/fluid/dataset.py
+++ b/python/paddle/fluid/dataset.py
--- a/python/paddle/fluid/debugger.py
+++ b/python/paddle/fluid/debugger.py
--- a/python/paddle/fluid/device_worker.py
+++ b/python/paddle/fluid/device_worker.py
--- a/python/paddle/fluid/distribute_lookup_table.py
+++ b/python/paddle/fluid/distribute_lookup_table.py
--- a/python/paddle/fluid/distributed/downpour.py
+++ b/python/paddle/fluid/distributed/downpour.py
--- a/python/paddle/fluid/distributed/fleet.py
+++ b/python/paddle/fluid/distributed/fleet.py
--- a/python/paddle/fluid/distributed/helper.py
+++ b/python/paddle/fluid/distributed/helper.py
--- a/python/paddle/fluid/distributed/node.py
+++ b/python/paddle/fluid/distributed/node.py
--- a/python/paddle/fluid/distributed/ps_instance.py
+++ b/python/paddle/fluid/distributed/ps_instance.py
--- a/python/paddle/fluid/distributed/ps_pb2.py
+++ b/python/paddle/fluid/distributed/ps_pb2.py
--- a/python/paddle/fluid/dygraph/amp/auto_cast.py
+++ b/python/paddle/fluid/dygraph/amp/auto_cast.py
--- a/python/paddle/fluid/dygraph/amp/loss_scaler.py
+++ b/python/paddle/fluid/dygraph/amp/loss_scaler.py
--- a/python/paddle/fluid/dygraph/base.py
+++ b/python/paddle/fluid/dygraph/base.py
--- a/python/paddle/fluid/dygraph/checkpoint.py
+++ b/python/paddle/fluid/dygraph/checkpoint.py
--- a/python/paddle/fluid/dygraph/container.py
+++ b/python/paddle/fluid/dygraph/container.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/assert_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/assert_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/ast_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/ast_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/base_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/base_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/basic_api_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/basic_api_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/break_continue_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/break_continue_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/call_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/call_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/cast_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/cast_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/convert_call_func.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/convert_call_func.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/convert_operators.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/convert_operators.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/create_variable_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/create_variable_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/decorator_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/decorator_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/early_return_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/early_return_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/error.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/error.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/function_spec.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/function_spec.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/ifelse_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/ifelse_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/logging_utils.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/logging_utils.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/logical_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/logical_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/loop_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/loop_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/origin_info.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/origin_info.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/partial_program.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/partial_program.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/print_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/print_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/program_translator.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/program_translator.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/return_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/return_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/static_analysis.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/static_analysis.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/tensor_shape_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/tensor_shape_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/typehint_transformer.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/typehint_transformer.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/utils.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/utils.py
--- a/python/paddle/fluid/dygraph/dygraph_to_static/variable_trans_func.py
+++ b/python/paddle/fluid/dygraph/dygraph_to_static/variable_trans_func.py
--- a/python/paddle/fluid/dygraph/inplace_utils.py
+++ b/python/paddle/fluid/dygraph/inplace_utils.py
--- a/python/paddle/fluid/dygraph/io.py
+++ b/python/paddle/fluid/dygraph/io.py
--- a/python/paddle/fluid/dygraph/jit.py
+++ b/python/paddle/fluid/dygraph/jit.py
--- a/python/paddle/fluid/dygraph/layer_hooks.py
+++ b/python/paddle/fluid/dygraph/layer_hooks.py
--- a/python/paddle/fluid/dygraph/layer_object_helper.py
+++ b/python/paddle/fluid/dygraph/layer_object_helper.py
--- a/python/paddle/fluid/dygraph/layers.py
+++ b/python/paddle/fluid/dygraph/layers.py
--- a/python/paddle/fluid/dygraph/learning_rate_scheduler.py
+++ b/python/paddle/fluid/dygraph/learning_rate_scheduler.py
--- a/python/paddle/fluid/dygraph/math_op_patch.py
+++ b/python/paddle/fluid/dygraph/math_op_patch.py
--- a/python/paddle/fluid/dygraph/nn.py
+++ b/python/paddle/fluid/dygraph/nn.py
--- a/python/paddle/fluid/dygraph/parallel.py
+++ b/python/paddle/fluid/dygraph/parallel.py
--- a/python/paddle/fluid/dygraph/parallel_helper.py
+++ b/python/paddle/fluid/dygraph/parallel_helper.py
--- a/python/paddle/fluid/dygraph/rnn.py
+++ b/python/paddle/fluid/dygraph/rnn.py
--- a/python/paddle/fluid/dygraph/tracer.py
+++ b/python/paddle/fluid/dygraph/tracer.py
--- a/python/paddle/fluid/dygraph/varbase_patch_methods.py
+++ b/python/paddle/fluid/dygraph/varbase_patch_methods.py
--- a/python/paddle/fluid/dygraph_utils.py
+++ b/python/paddle/fluid/dygraph_utils.py
--- a/python/paddle/fluid/entry_attr.py
+++ b/python/paddle/fluid/entry_attr.py
--- a/python/paddle/fluid/evaluator.py
+++ b/python/paddle/fluid/evaluator.py
--- a/python/paddle/fluid/executor.py
+++ b/python/paddle/fluid/executor.py
--- a/python/paddle/fluid/framework.py
+++ b/python/paddle/fluid/framework.py
--- a/python/paddle/fluid/generator.py
+++ b/python/paddle/fluid/generator.py
--- a/python/paddle/fluid/graphviz.py
+++ b/python/paddle/fluid/graphviz.py
--- a/python/paddle/fluid/incubate/checkpoint/auto_checkpoint.py
+++ b/python/paddle/fluid/incubate/checkpoint/auto_checkpoint.py
--- a/python/paddle/fluid/incubate/checkpoint/checkpoint_saver.py
+++ b/python/paddle/fluid/incubate/checkpoint/checkpoint_saver.py
--- a/python/paddle/fluid/incubate/data_generator/__init__.py
+++ b/python/paddle/fluid/incubate/data_generator/__init__.py
--- a/python/paddle/fluid/incubate/fleet/base/fleet_base.py
+++ b/python/paddle/fluid/incubate/fleet/base/fleet_base.py
--- a/python/paddle/fluid/incubate/fleet/base/mode.py
+++ b/python/paddle/fluid/incubate/fleet/base/mode.py
--- a/python/paddle/fluid/incubate/fleet/base/role_maker.py
+++ b/python/paddle/fluid/incubate/fleet/base/role_maker.py
--- a/python/paddle/fluid/incubate/fleet/collective/__init__.py
+++ b/python/paddle/fluid/incubate/fleet/collective/__init__.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/__init__.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/__init__.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/distributed_strategy.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/distribute_transpiler/distributed_strategy.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/heter_trainer_pass.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/heter_trainer_pass.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/pserver_pass.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/pserver_pass.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/public.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/public.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/trainer_pass.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/trainer_pass.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/ufind.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/ufind.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/ir/vars_metatools.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/ir/vars_metatools.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/mode.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/mode.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/__init__.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/__init__.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/node.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/node.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/ps_pb2.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/ps_pb2.py
--- a/python/paddle/fluid/incubate/fleet/tests/ctr_dataset_reader.py
+++ b/python/paddle/fluid/incubate/fleet/tests/ctr_dataset_reader.py
--- a/python/paddle/fluid/incubate/fleet/tests/fleet_deep_ctr.py
+++ b/python/paddle/fluid/incubate/fleet/tests/fleet_deep_ctr.py
--- a/python/paddle/fluid/incubate/fleet/utils/fleet_util.py
+++ b/python/paddle/fluid/incubate/fleet/utils/fleet_util.py
--- a/python/paddle/fluid/incubate/fleet/utils/hdfs.py
+++ b/python/paddle/fluid/incubate/fleet/utils/hdfs.py
--- a/python/paddle/fluid/incubate/fleet/utils/http_server.py
+++ b/python/paddle/fluid/incubate/fleet/utils/http_server.py
--- a/python/paddle/fluid/incubate/fleet/utils/utils.py
+++ b/python/paddle/fluid/incubate/fleet/utils/utils.py
--- a/python/paddle/fluid/inference/__init__.py
+++ b/python/paddle/fluid/inference/__init__.py
--- a/python/paddle/fluid/inference/wrapper.py
+++ b/python/paddle/fluid/inference/wrapper.py
--- a/python/paddle/fluid/initializer.py
+++ b/python/paddle/fluid/initializer.py
--- a/python/paddle/fluid/input.py
+++ b/python/paddle/fluid/input.py
--- a/python/paddle/fluid/install_check.py
+++ b/python/paddle/fluid/install_check.py
--- a/python/paddle/fluid/io.py
+++ b/python/paddle/fluid/io.py
--- a/python/paddle/fluid/ir.py
+++ b/python/paddle/fluid/ir.py
--- a/python/paddle/fluid/layer_helper.py
+++ b/python/paddle/fluid/layer_helper.py
--- a/python/paddle/fluid/layer_helper_base.py
+++ b/python/paddle/fluid/layer_helper_base.py
--- a/python/paddle/fluid/layers/collective.py
+++ b/python/paddle/fluid/layers/collective.py
--- a/python/paddle/fluid/layers/control_flow.py
+++ b/python/paddle/fluid/layers/control_flow.py
--- a/python/paddle/fluid/layers/detection.py
+++ b/python/paddle/fluid/layers/detection.py
--- a/python/paddle/fluid/layers/device.py
+++ b/python/paddle/fluid/layers/device.py
--- a/python/paddle/fluid/layers/distributions.py
+++ b/python/paddle/fluid/layers/distributions.py
--- a/python/paddle/fluid/layers/io.py
+++ b/python/paddle/fluid/layers/io.py
--- a/python/paddle/fluid/layers/layer_function_generator.py
+++ b/python/paddle/fluid/layers/layer_function_generator.py
--- a/python/paddle/fluid/layers/learning_rate_scheduler.py
+++ b/python/paddle/fluid/layers/learning_rate_scheduler.py
--- a/python/paddle/fluid/layers/loss.py
+++ b/python/paddle/fluid/layers/loss.py
--- a/python/paddle/fluid/layers/math_op_patch.py
+++ b/python/paddle/fluid/layers/math_op_patch.py
--- a/python/paddle/fluid/layers/metric_op.py
+++ b/python/paddle/fluid/layers/metric_op.py
--- a/python/paddle/fluid/layers/nn.py
+++ b/python/paddle/fluid/layers/nn.py
--- a/python/paddle/fluid/layers/ops.py
+++ b/python/paddle/fluid/layers/ops.py
--- a/python/paddle/fluid/layers/rnn.py
+++ b/python/paddle/fluid/layers/rnn.py
--- a/python/paddle/fluid/layers/sequence_lod.py
+++ b/python/paddle/fluid/layers/sequence_lod.py
--- a/python/paddle/fluid/layers/tensor.py
+++ b/python/paddle/fluid/layers/tensor.py
--- a/python/paddle/fluid/layers/utils.py
+++ b/python/paddle/fluid/layers/utils.py
--- a/python/paddle/fluid/lazy_init.py
+++ b/python/paddle/fluid/lazy_init.py
--- a/python/paddle/fluid/lod_tensor.py
+++ b/python/paddle/fluid/lod_tensor.py
--- a/python/paddle/fluid/memory_analysis.py
+++ b/python/paddle/fluid/memory_analysis.py
--- a/python/paddle/fluid/metrics.py
+++ b/python/paddle/fluid/metrics.py
--- a/python/paddle/fluid/multiprocess_utils.py
+++ b/python/paddle/fluid/multiprocess_utils.py
--- a/python/paddle/fluid/net_drawer.py
+++ b/python/paddle/fluid/net_drawer.py
--- a/python/paddle/fluid/nets.py
+++ b/python/paddle/fluid/nets.py
--- a/python/paddle/fluid/op.py
+++ b/python/paddle/fluid/op.py
--- a/python/paddle/fluid/optimizer.py
+++ b/python/paddle/fluid/optimizer.py
--- a/python/paddle/fluid/parallel_executor.py
+++ b/python/paddle/fluid/parallel_executor.py
--- a/python/paddle/fluid/param_attr.py
+++ b/python/paddle/fluid/param_attr.py
--- a/python/paddle/fluid/profiler.py
+++ b/python/paddle/fluid/profiler.py
--- a/python/paddle/fluid/reader.py
+++ b/python/paddle/fluid/reader.py
--- a/python/paddle/fluid/regularizer.py
+++ b/python/paddle/fluid/regularizer.py
--- a/python/paddle/fluid/tests/book/notest_understand_sentiment.py
+++ b/python/paddle/fluid/tests/book/notest_understand_sentiment.py
--- a/python/paddle/fluid/tests/book/test_fit_a_line.py
+++ b/python/paddle/fluid/tests/book/test_fit_a_line.py
--- a/python/paddle/fluid/tests/book/test_image_classification.py
+++ b/python/paddle/fluid/tests/book/test_image_classification.py
--- a/python/paddle/fluid/tests/book/test_label_semantic_roles.py
+++ b/python/paddle/fluid/tests/book/test_label_semantic_roles.py
--- a/python/paddle/fluid/tests/book/test_machine_translation.py
+++ b/python/paddle/fluid/tests/book/test_machine_translation.py
--- a/python/paddle/fluid/tests/book/test_recognize_digits.py
+++ b/python/paddle/fluid/tests/book/test_recognize_digits.py
--- a/python/paddle/fluid/tests/book/test_recommender_system.py
+++ b/python/paddle/fluid/tests/book/test_recommender_system.py
--- a/python/paddle/fluid/tests/book/test_rnn_encoder_decoder.py
+++ b/python/paddle/fluid/tests/book/test_rnn_encoder_decoder.py
--- a/python/paddle/fluid/tests/book/test_word2vec_book.py
+++ b/python/paddle/fluid/tests/book/test_word2vec_book.py
--- a/python/paddle/fluid/tests/custom_kernel/custom_kernel_dot_c_setup.py
+++ b/python/paddle/fluid/tests/custom_kernel/custom_kernel_dot_c_setup.py
--- a/python/paddle/fluid/tests/custom_kernel/custom_kernel_dot_setup.py
+++ b/python/paddle/fluid/tests/custom_kernel/custom_kernel_dot_setup.py
--- a/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_dot.py
+++ b/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_dot.py
--- a/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_load.py
+++ b/python/paddle/fluid/tests/custom_kernel/test_custom_kernel_load.py
--- a/python/paddle/fluid/tests/custom_op/custom_raw_op_kernel_op_setup.py
+++ b/python/paddle/fluid/tests/custom_op/custom_raw_op_kernel_op_setup.py
--- a/python/paddle/fluid/tests/custom_op/custom_relu_setup.py
+++ b/python/paddle/fluid/tests/custom_op/custom_relu_setup.py
--- a/python/paddle/fluid/tests/custom_op/test_check_abi.py
+++ b/python/paddle/fluid/tests/custom_op/test_check_abi.py
--- a/python/paddle/fluid/tests/custom_op/test_context_pool.py
+++ b/python/paddle/fluid/tests/custom_op/test_context_pool.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_attrs_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_attrs_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_concat.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_concat.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_conj.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_conj.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_linear.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_linear.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_raw_op_kernel_op.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_raw_op_kernel_op.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_relu_model.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_relu_model.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_relu_op_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_relu_op_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_relu_op_setup.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_relu_op_setup.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_simple_slice.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_simple_slice.py
--- a/python/paddle/fluid/tests/custom_op/test_custom_tanh_double_grad.py
+++ b/python/paddle/fluid/tests/custom_op/test_custom_tanh_double_grad.py
--- a/python/paddle/fluid/tests/custom_op/test_dispatch_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_dispatch_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_multi_out_jit.py
+++ b/python/paddle/fluid/tests/custom_op/test_multi_out_jit.py
--- a/python/paddle/fluid/tests/custom_op/test_sysconfig.py
+++ b/python/paddle/fluid/tests/custom_op/test_sysconfig.py
--- a/python/paddle/fluid/tests/custom_op/utils.py
+++ b/python/paddle/fluid/tests/custom_op/utils.py
--- a/python/paddle/fluid/tests/custom_runtime/custom_device_multi_process_collective.py
+++ b/python/paddle/fluid/tests/custom_runtime/custom_device_multi_process_collective.py
--- a/python/paddle/fluid/tests/custom_runtime/process_group_xccl.py
+++ b/python/paddle/fluid/tests/custom_runtime/process_group_xccl.py
--- a/python/paddle/fluid/tests/custom_runtime/test_collective_process_group_xccl.py
+++ b/python/paddle/fluid/tests/custom_runtime/test_collective_process_group_xccl.py
--- a/python/paddle/fluid/tests/custom_runtime/test_custom_cpu_plugin.py
+++ b/python/paddle/fluid/tests/custom_runtime/test_custom_cpu_plugin.py
--- a/python/paddle/fluid/tests/custom_runtime/test_custom_cpu_profiler_plugin.py
+++ b/python/paddle/fluid/tests/custom_runtime/test_custom_cpu_profiler_plugin.py
--- a/python/paddle/fluid/tests/custom_runtime/test_custom_cpu_to_static.py
+++ b/python/paddle/fluid/tests/custom_runtime/test_custom_cpu_to_static.py
--- a/python/paddle/fluid/tests/test_beam_search_decoder.py
+++ b/python/paddle/fluid/tests/test_beam_search_decoder.py
--- a/python/paddle/fluid/tests/test_data_feeder.py
+++ b/python/paddle/fluid/tests/test_data_feeder.py
--- a/python/paddle/fluid/tests/test_detection.py
+++ b/python/paddle/fluid/tests/test_detection.py
--- a/python/paddle/fluid/tests/test_error_clip.py
+++ b/python/paddle/fluid/tests/test_error_clip.py
--- a/python/paddle/fluid/tests/test_if_else_op.py
+++ b/python/paddle/fluid/tests/test_if_else_op.py
--- a/python/paddle/fluid/tests/test_lod_tensor.py
+++ b/python/paddle/fluid/tests/test_lod_tensor.py
--- a/python/paddle/fluid/tests/test_python_operator_overriding.py
+++ b/python/paddle/fluid/tests/test_python_operator_overriding.py
--- a/python/paddle/fluid/tests/test_sequential.py
+++ b/python/paddle/fluid/tests/test_sequential.py
--- a/python/paddle/fluid/tests/unittests/__init__.py
+++ b/python/paddle/fluid/tests/unittests/__init__.py
--- a/python/paddle/fluid/tests/unittests/ascend_group.py
+++ b/python/paddle/fluid/tests/unittests/ascend_group.py
--- a/python/paddle/fluid/tests/unittests/ascend_multi_process_collective.py
+++ b/python/paddle/fluid/tests/unittests/ascend_multi_process_collective.py
--- a/python/paddle/fluid/tests/unittests/asp/asp_pruning_base.py
+++ b/python/paddle/fluid/tests/unittests/asp/asp_pruning_base.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_customized_pruning.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_customized_pruning.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_dynamic.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_static.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_optimize_static.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_dynamic.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_static.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_pruning_static.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_save_load.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_save_load.py
--- a/python/paddle/fluid/tests/unittests/asp/test_asp_utils.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_asp_utils.py
--- a/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_dynamic.py
--- a/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_sharding.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_sharding.py
--- a/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_static.py
+++ b/python/paddle/fluid/tests/unittests/asp/test_fleet_with_asp_static.py
--- a/python/paddle/fluid/tests/unittests/auto_checkpoint_utils.py
+++ b/python/paddle/fluid/tests/unittests/auto_checkpoint_utils.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/amp_pass_unittest.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/amp_pass_unittest.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_model.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_model.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_gpt_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_gpt_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/auto_parallel_relaunch_with_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/clip_grad_by_global_norm.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/clip_grad_by_global_norm.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/converter.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/converter.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/engine_api.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/engine_api.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/engine_api_dp.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/engine_api_dp.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/get_gpt_model.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/get_gpt_model.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/gradient_merge_pass_unittest.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/gradient_merge_pass_unittest.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/high_order_grad.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/high_order_grad.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/iterable_dataset.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/iterable_dataset.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/optimization_tuner_api.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/optimization_tuner_api.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/recompute_pass_unittest.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/recompute_pass_unittest.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/sharding_pass_unittest.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/sharding_pass_unittest.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_auto_parallel_relaunch.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_auto_parallel_relaunch.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_base_cost.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_base_cost.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_cluster.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_cluster.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_cluster_v2.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_cluster_v2.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_comm_cost.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_comm_cost.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_comp_cost.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_comp_cost.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_conditional_block_reshard.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_conditional_block_reshard.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_converter.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_converter.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_assign.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_assign.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_attr_v2.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_attr_v2.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_context.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_context.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_embedding.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_embedding.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_matmul.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_matmul.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_op_cost.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_op_cost.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_pnorm.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_pnorm.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_reshape.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_reshape.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_shape.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_shape.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_slice.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_slice.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_split.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_dist_split.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_api.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_api.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_api_dp.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_api_dp.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_callbacks.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_engine_callbacks.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_high_order_grad.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_high_order_grad.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_interface.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_interface.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_iterable_dataset.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_iterable_dataset.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_lr_grad_clip.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_lr_grad_clip.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_new_cost_model.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_new_cost_model.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_optimization_tuner_api.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_optimization_tuner_api.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_parallel_tuner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_parallel_tuner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_parallel_tuner_full.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_parallel_tuner_full.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_parallel_tuner_predict.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_parallel_tuner_predict.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_amp.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_amp.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_grad_clip.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_grad_clip.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_gradient_merge.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_gradient_merge.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_quantization.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_quantization.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_recompute.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_recompute.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_sharding.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_pass_sharding.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_prim_dist_op.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_prim_dist_op.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_process_mesh.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_process_mesh.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_process_mesh_v2.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_process_mesh_v2.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_recorder.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_recorder.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_gpt_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_gpt_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_planner.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_relaunch_with_planner.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_strategy.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_strategy.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_to_static.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_to_static.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_trial.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_trial.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_space.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_space.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_variable.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_tunable_variable.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_completion.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_completion.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_partition.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel/test_while_op_partition.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_autoconvert.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_autoconvert.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_data_unshard.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_data_unshard.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_gpt_model.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_gpt_model.py
--- a/python/paddle/fluid/tests/unittests/auto_parallel_save_load.py
+++ b/python/paddle/fluid/tests/unittests/auto_parallel_save_load.py
--- a/python/paddle/fluid/tests/unittests/autograd/config.py
+++ b/python/paddle/fluid/tests/unittests/autograd/config.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_dynamic.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_dynamic.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_prim.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_prim.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_static.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_autograd_functional_static.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_jvp_and_transpose.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_jvp_and_transpose.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_minimize.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_minimize.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_orig2prim.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_orig2prim.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_prim2orig.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_prim2orig.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_primapi.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_primapi.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_primops.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_primops.py
--- a/python/paddle/fluid/tests/unittests/autograd/test_transform.py
+++ b/python/paddle/fluid/tests/unittests/autograd/test_transform.py
--- a/python/paddle/fluid/tests/unittests/autograd/utils.py
+++ b/python/paddle/fluid/tests/unittests/autograd/utils.py
--- a/python/paddle/fluid/tests/unittests/benchmark.py
+++ b/python/paddle/fluid/tests/unittests/benchmark.py
--- a/python/paddle/fluid/tests/unittests/benchmark_sum_op.py
+++ b/python/paddle/fluid/tests/unittests/benchmark_sum_op.py
--- a/python/paddle/fluid/tests/unittests/c_embedding_op_base.py
+++ b/python/paddle/fluid/tests/unittests/c_embedding_op_base.py
--- a/python/paddle/fluid/tests/unittests/check_nan_inf_base.py
+++ b/python/paddle/fluid/tests/unittests/check_nan_inf_base.py
--- a/python/paddle/fluid/tests/unittests/check_nan_inf_base_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/check_nan_inf_base_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allgather_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allgather_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allgather_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allgather_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allgather_object_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allgather_object_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allreduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allreduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allreduce_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allreduce_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allreduce_new_group_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allreduce_new_group_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allreduce_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allreduce_op.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_allreduce_op_wait.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_allreduce_op_wait.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_alltoall_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_alltoall_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_alltoall_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_alltoall_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_alltoall_single.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_alltoall_single.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_alltoall_single_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_alltoall_single_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_barrier_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_barrier_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_batch_isend_irecv.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_batch_isend_irecv.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_broadcast_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_broadcast_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_broadcast_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_broadcast_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_broadcast_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_broadcast_op.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_concat_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_concat_op.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_global_gather.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_global_gather.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_global_gather_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_global_gather_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_global_scatter.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_global_scatter.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_global_scatter_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_global_scatter_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_identity_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_identity_op.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_isend_irecv_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_isend_irecv_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_reduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_reduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_reduce_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_reduce_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_reduce_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_reduce_op.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_reduce_op_calc_stream.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_reduce_op_calc_stream.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_reduce_scatter.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_reduce_scatter.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_reduce_scatter_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_reduce_scatter_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_scatter_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_scatter_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_scatter_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_scatter_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_scatter_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_scatter_op.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_api.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_op.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_op_array.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_op_array.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_op_dynamic_shape.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_sendrecv_op_dynamic_shape.py
--- a/python/paddle/fluid/tests/unittests/collective/collective_split_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/collective_split_op.py
--- a/python/paddle/fluid/tests/unittests/collective/column_parallel_linear_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/column_parallel_linear_api.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_allgather_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_allgather_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_allreduce_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_allreduce_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_alltoall_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_alltoall_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_alltoall_single_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_alltoall_single_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_broadcast_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_broadcast_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_reduce_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_reduce_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_reduce_scatter_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_reduce_scatter_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_scatter_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_scatter_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/communication_stream_sendrecv_api_dygraph.py
+++ b/python/paddle/fluid/tests/unittests/collective/communication_stream_sendrecv_api_dygraph.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/auto_parallel_parallelizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/auto_parallel_parallelizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/c_comm_init_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/c_comm_init_op.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dist_mnist_gradient_merge.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dist_mnist_gradient_merge.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dist_mnist_gradient_merge_raw_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dist_mnist_gradient_merge_raw_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_api.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_api_eager.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_api_eager.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage2.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage2.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage2_comm_overlap.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage2_comm_overlap.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage2_offload.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage2_offload.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage3.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage3.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage3_offload.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage3_offload.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_optimizer_stage2.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_optimizer_stage2.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage2.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage2.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage2_offload.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage2_offload.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage3.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage3.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage3_offload.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/dygraph_sharding_stage3_offload.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_communicate_group.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_communicate_group.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_inference_helper.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_inference_helper.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_amp.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_amp.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_clip_grad.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_clip_grad.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_fp16.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_fp16.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_layers.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_layers.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_model.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_model.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_random.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_mp_random.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_amp.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_amp.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_clip_grad.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_clip_grad.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_embedding.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_embedding.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_fp16.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_fp16.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_layer_with_virtual_stage.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_layer_with_virtual_stage.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_recompute.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_recompute.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_save_load.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_save_load.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_save_load_with_virtual_stage.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_save_load_with_virtual_stage.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_transformer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_transformer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_transformer_with_virtual_stage.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_pp_transformer_with_virtual_stage.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_qat.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_qat.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_sharding_model.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_sharding_model.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_shared_weight.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/hybrid_parallel_shared_weight.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/new_group.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/new_group.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_class_center_sample.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_class_center_sample.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_control_flow_different.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_control_flow_different.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_control_flow_same.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_control_flow_same.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync_control_flow.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync_control_flow.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync_gradient_check.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync_gradient_check.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync_unused_params.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_no_sync_unused_params.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_se_resnext.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_se_resnext.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_sync_batch_norm.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_sync_batch_norm.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_transformer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_dygraph_transformer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/parallel_margin_cross_entropy.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/parallel_margin_cross_entropy.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/pipeline_mnist.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/pipeline_mnist.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/pipeline_mnist_multi_device.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/pipeline_mnist_multi_device.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/pipeline_mnist_one_device.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/pipeline_mnist_one_device.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/static_model_parallel_by_col.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/static_model_parallel_by_col.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/static_model_parallel_by_row.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/static_model_parallel_by_row.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/static_model_parallel_embedding.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/static_model_parallel_embedding.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint1.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint1.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint2.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint2.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint3.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint3.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint_dist_basic.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint_dist_basic.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint_multiple.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_auto_checkpoint_multiple.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_communicator_half_async.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_communicator_half_async.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_communicator_sync.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_communicator_sync.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dgc_momentum_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dgc_momentum_op.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dgc_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dgc_op.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dgc_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dgc_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dist_mnist_dgc_nccl.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dist_mnist_dgc_nccl.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dist_mnist_gradient_merge.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dist_mnist_gradient_merge.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dist_se_resnext_dgc.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dist_se_resnext_dgc.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_distributed_strategy.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_distributed_strategy.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_recompute.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_recompute.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_recompute_for_eager.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_recompute_for_eager.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_sharding_optimizer_stage2.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_sharding_optimizer_stage2.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_sharding_stage2.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_sharding_stage2.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_sharding_stage3.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_dygraph_sharding_stage3.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_amp_init.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_amp_init.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_amp_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_amp_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_checkpoint.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_checkpoint.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_dgc_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_dgc_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_distributed_strategy.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_distributed_strategy.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_fp16_allreduce_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_fp16_allreduce_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_gradient_merge_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_gradient_merge_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_graph_execution_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_graph_execution_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_graph_executor.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_graph_executor.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_hybrid_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_hybrid_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_lamb_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_lamb_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_lars_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_lars_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_localsgd_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_localsgd_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_log.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_log.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_meta_optimizer_base.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_meta_optimizer_base.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_pipeline_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_pipeline_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_pipeline_meta_optimizer_with_recompute.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_pipeline_meta_optimizer_with_recompute.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_private_function.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_private_function.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_raw_program_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_raw_program_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_recompute_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_recompute_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_rolemaker_new.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_rolemaker_new.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_sharding_meta_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_sharding_meta_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_static_mp_layers.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_static_mp_layers.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_utils.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_fleet_utils.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_hdfs1.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_hdfs1.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_hdfs2.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_hdfs2.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_hdfs3.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_hdfs3.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_hybrid_parallel_inference_helper.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_hybrid_parallel_inference_helper.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_imperative_auto_mixed_precision.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_imperative_auto_mixed_precision.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_imperative_auto_mixed_precision_for_eager.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_imperative_auto_mixed_precision_for_eager.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_ir_pass_pipeline.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_ir_pass_pipeline.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_mixed_precision.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_mixed_precision.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_class_center_sample.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_class_center_sample.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_control_flow.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_control_flow.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_mnist.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_mnist.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_mp_layers.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_mp_layers.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_no_sync.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_no_sync.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_no_sync_gradient_check.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_no_sync_gradient_check.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_pipeline_parallel.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_pipeline_parallel.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_pipeline_parallel_with_virtual_stage.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_pipeline_parallel_with_virtual_stage.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_qat.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_qat.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_se_resnext.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_se_resnext.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sharding_parallel.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sharding_parallel.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sparse_embedding.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sparse_embedding.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sparse_embedding_over_height.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sparse_embedding_over_height.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sync_batch_norm.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_sync_batch_norm.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_tensor_parallel.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_tensor_parallel.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_transformer.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_transformer.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_unused_variables.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_dygraph_unused_variables.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_margin_cross_entropy.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_parallel_margin_cross_entropy.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_pipeline.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_pipeline.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_recv_save_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_recv_save_op.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_rnn_dp.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_rnn_dp.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_static_model_parallel.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_static_model_parallel.py
--- a/python/paddle/fluid/tests/unittests/collective/fleet/test_tcp_store.py
+++ b/python/paddle/fluid/tests/unittests/collective/fleet/test_tcp_store.py
--- a/python/paddle/fluid/tests/unittests/collective/init_process_group.py
+++ b/python/paddle/fluid/tests/unittests/collective/init_process_group.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/common.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/common.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_dp.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_dp.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_dpppmp.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_dpppmp.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_fp16.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_fp16.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_recompute.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/dygraph_hybrid_recompute.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/mn_dygraph_group_sharded_stage3.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/mn_dygraph_group_sharded_stage3.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/mn_dygraph_sharding_stage2.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/mn_dygraph_sharding_stage2.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/test_collective_multi_nodes.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/test_collective_multi_nodes.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/test_multinode_dygraph_hybrid_dp.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/test_multinode_dygraph_hybrid_dp.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/test_multinode_dygraph_hybrid_dpppmp.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/test_multinode_dygraph_hybrid_dpppmp.py
--- a/python/paddle/fluid/tests/unittests/collective/multinode/test_multinode_dygraph_sharding.py
+++ b/python/paddle/fluid/tests/unittests/collective/multinode/test_multinode_dygraph_sharding.py
--- a/python/paddle/fluid/tests/unittests/collective/orthogonal_strategy.py
+++ b/python/paddle/fluid/tests/unittests/collective/orthogonal_strategy.py
--- a/python/paddle/fluid/tests/unittests/collective/parallel_embedding_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/parallel_embedding_api.py
--- a/python/paddle/fluid/tests/unittests/collective/process_group_gloo.py
+++ b/python/paddle/fluid/tests/unittests/collective/process_group_gloo.py
--- a/python/paddle/fluid/tests/unittests/collective/process_group_mpi.py
+++ b/python/paddle/fluid/tests/unittests/collective/process_group_mpi.py
--- a/python/paddle/fluid/tests/unittests/collective/process_group_nccl.py
+++ b/python/paddle/fluid/tests/unittests/collective/process_group_nccl.py
--- a/python/paddle/fluid/tests/unittests/collective/row_parallel_linear_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/row_parallel_linear_api.py
--- a/python/paddle/fluid/tests/unittests/collective/strategy_group.py
+++ b/python/paddle/fluid/tests/unittests/collective/strategy_group.py
--- a/python/paddle/fluid/tests/unittests/collective/test_allreduce.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_allreduce.py
--- a/python/paddle/fluid/tests/unittests/collective/test_broadcast.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_broadcast.py
--- a/python/paddle/fluid/tests/unittests/collective/test_c_concat.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_c_concat.py
--- a/python/paddle/fluid/tests/unittests/collective/test_c_identity.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_c_identity.py
--- a/python/paddle/fluid/tests/unittests/collective/test_c_split.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_c_split.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_allgather_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_allgather_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_allgather_object_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_allgather_object_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_allreduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_allreduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_alltoall_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_alltoall_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_alltoall_single.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_alltoall_single.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_alltoall_single_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_alltoall_single_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_barrier_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_barrier_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_batch_isend_irecv.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_batch_isend_irecv.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_broadcast_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_broadcast_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_cpu_barrier_with_gloo.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_cpu_barrier_with_gloo.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_global_gather.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_global_gather.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_global_scatter.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_global_scatter.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_isend_irecv_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_isend_irecv_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_optimizer.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_process_group.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_process_group.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_reduce.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_reduce.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_reduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_reduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_reduce_scatter.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_reduce_scatter.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_reduce_scatter_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_reduce_scatter_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_scatter.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_scatter.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_scatter_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_scatter_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_sendrecv.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_sendrecv.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_sendrecv_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_sendrecv_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_split_col_linear.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_split_col_linear.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_split_embedding.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_split_embedding.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_split_embedding_none_divisible.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_split_embedding_none_divisible.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_split_row_linear.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_split_row_linear.py
--- a/python/paddle/fluid/tests/unittests/collective/test_collective_wait.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_collective_wait.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_api_base.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_api_base.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_allgather_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_allgather_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_allreduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_allreduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_alltoall_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_alltoall_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_alltoall_single_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_alltoall_single_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_broadcast_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_broadcast_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_reduce_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_reduce_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_reduce_scatter_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_reduce_scatter_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_scatter_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_scatter_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_communication_stream_sendrecv_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_communication_stream_sendrecv_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_eager_dist_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_eager_dist_api.py
--- a/python/paddle/fluid/tests/unittests/collective/test_gen_nccl_id_op.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_gen_nccl_id_op.py
--- a/python/paddle/fluid/tests/unittests/collective/test_new_group_api.py
+++ b/python/paddle/fluid/tests/unittests/collective/test_new_group_api.py
--- a/python/paddle/fluid/tests/unittests/collective/world_size_and_rank.py
+++ b/python/paddle/fluid/tests/unittests/collective/world_size_and_rank.py
--- a/python/paddle/fluid/tests/unittests/collective_allgather_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_allgather_op.py
--- a/python/paddle/fluid/tests/unittests/collective_reducescatter.py
+++ b/python/paddle/fluid/tests/unittests/collective_reducescatter.py
--- a/python/paddle/fluid/tests/unittests/collective_reducescatter_op.py
+++ b/python/paddle/fluid/tests/unittests/collective_reducescatter_op.py
--- a/python/paddle/fluid/tests/unittests/ctr_dataset_reader.py
+++ b/python/paddle/fluid/tests/unittests/ctr_dataset_reader.py
--- a/python/paddle/fluid/tests/unittests/decorator_helper.py
+++ b/python/paddle/fluid/tests/unittests/decorator_helper.py
--- a/python/paddle/fluid/tests/unittests/detected_gpu.py
+++ b/python/paddle/fluid/tests/unittests/detected_gpu.py
--- a/python/paddle/fluid/tests/unittests/dist_allreduce_op.py
+++ b/python/paddle/fluid/tests/unittests/dist_allreduce_op.py
--- a/python/paddle/fluid/tests/unittests/dist_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_ctr_reader.py
+++ b/python/paddle/fluid/tests/unittests/dist_ctr_reader.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_ctr_ps_gpu.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_ctr_ps_gpu.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_debug_gloo.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_debug_gloo.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_heter_pipeline_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_heter_pipeline_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer_fuse_allreduce.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_raw_program_optimizer_fuse_allreduce.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_simnet_bow.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_simnet_bow.py
--- a/python/paddle/fluid/tests/unittests/dist_fleet_sparse_embedding_ctr.py
+++ b/python/paddle/fluid/tests/unittests/dist_fleet_sparse_embedding_ctr.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_batch_merge.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_batch_merge.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_fp16_allreduce.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_fp16_allreduce.py
--- a/python/paddle/fluid/tests/unittests/dist_mnist_lars.py
+++ b/python/paddle/fluid/tests/unittests/dist_mnist_lars.py
--- a/python/paddle/fluid/tests/unittests/dist_save_load.py
+++ b/python/paddle/fluid/tests/unittests/dist_save_load.py
--- a/python/paddle/fluid/tests/unittests/dist_se_resnext.py
+++ b/python/paddle/fluid/tests/unittests/dist_se_resnext.py
--- a/python/paddle/fluid/tests/unittests/dist_sharding_save.py
+++ b/python/paddle/fluid/tests/unittests/dist_sharding_save.py
--- a/python/paddle/fluid/tests/unittests/dist_text_classification.py
+++ b/python/paddle/fluid/tests/unittests/dist_text_classification.py
--- a/python/paddle/fluid/tests/unittests/dist_transformer.py
+++ b/python/paddle/fluid/tests/unittests/dist_transformer.py
--- a/python/paddle/fluid/tests/unittests/dist_word2vec.py
+++ b/python/paddle/fluid/tests/unittests/dist_word2vec.py
--- a/python/paddle/fluid/tests/unittests/distributed_fused_lamb_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_fused_lamb_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/auto_parallel_pass_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/auto_parallel_pass_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/check_pass_conflict_example.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/check_pass_conflict_example.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/dist_pass_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/dist_pass_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/model_zoo.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/model_zoo.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/pass_run_main.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/pass_run_main.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/ps_pass_test_base.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/ps_pass_test_base.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_amp_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_amp_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_data_parallel_optimization_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_data_parallel_optimization_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_fp16_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_fp16_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_gradient_merge_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_gradient_merge_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_recompute_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_recompute_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_sharding_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_auto_parallel_sharding_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_adam_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_adam_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_all_reduce_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_all_reduce_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_act_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_act_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_add_act_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_bn_add_act_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_momentum_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_momentum_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_relu_depthwise_conv_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_relu_depthwise_conv_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_sgd_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_fuse_sgd_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_inplace_addto_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_dist_inplace_addto_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_server_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_server_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_trainer_pass.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_ps_trainer_pass.py
--- a/python/paddle/fluid/tests/unittests/distributed_passes/test_white_lists.py
+++ b/python/paddle/fluid/tests/unittests/distributed_passes/test_white_lists.py
--- a/python/paddle/fluid/tests/unittests/distribution/config.py
+++ b/python/paddle/fluid/tests/unittests/distribution/config.py
--- a/python/paddle/fluid/tests/unittests/distribution/mock_data.py
+++ b/python/paddle/fluid/tests/unittests/distribution/mock_data.py
--- a/python/paddle/fluid/tests/unittests/distribution/parameterize.py
+++ b/python/paddle/fluid/tests/unittests/distribution/parameterize.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_dirichlet_op.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_dirichlet_op.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta.py
--- a/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta_static.py
+++ b/python/paddle/fluid/tests/unittests/distribution/test_distribution_beta_static.py