style(mge): apply format.sh

GitOrigin-RevId: a900b1bb6e8b6dde7a6737bfb8df9db6e79b45ce

style(mge): apply format.sh
GitOrigin-RevId: a900b1bb6e8b6dde7a6737bfb8df9db6e79b45ce
62b0c6cd · Megvii Engine Team · fc6aa12e · 62b0c6cd · 62b0c6cd · 62b0c6cd
12 changed file
--- a/python_module/megengine/core/tensor_nn.py
+++ b/python_module/megengine/core/tensor_nn.py
@@ -30,7 +30,7 @@ class Parameter(Tensor):
        else:
            t = tensor(value, dtype=dtype, device=device, requires_grad=requires_grad)
        self.__dict__.update(t.__dict__)
    @property
    def shape(self):
        r"""Return shape of parameter.

--- a/python_module/megengine/data/dataset/vision/coco.py
+++ b/python_module/megengine/data/dataset/vision/coco.py
@@ -12,9 +12,9 @@
 #
 # Copyright (c) 2018 Facebook
 # ---------------------------------------------------------------------
-from collections import OrderedDict, defaultdict
 import json
 import os
+from collections import OrderedDict, defaultdict
 import cv2
 import numpy as np

--- a/python_module/megengine/data/dataset/vision/imagenet.py
+++ b/python_module/megengine/data/dataset/vision/imagenet.py
@@ -87,7 +87,7 @@ class ImageNet(ImageFolder):
        if not os.path.exists(self.root):
            raise FileNotFoundError("dir %s does not exist" % self.root)
        self.devkit_dir = os.path.join(self.root, self.default_devkit_dir)
        if not os.path.exists(self.devkit_dir):
@@ -159,8 +159,14 @@ class ImageNet(ImageFolder):
            classes = [tuple(clss.split(", ")) for clss in classes]
            idx_to_wnid = {idx: wnid for idx, wnid in zip(idcs, wnids)}
            wnid_to_classes = {wnid: clss for wnid, clss in zip(wnids, classes)}
-            logger.info("saving cached meta file to %s", os.path.join(self.devkit_dir, "meta.pkl"))
+            logger.info(
-            save((idx_to_wnid, wnid_to_classes), os.path.join(self.devkit_dir, "meta.pkl"))
+                "saving cached meta file to %s",
+                os.path.join(self.devkit_dir, "meta.pkl"),
+            )
+            save(
+                (idx_to_wnid, wnid_to_classes),
+                os.path.join(self.devkit_dir, "meta.pkl"),
+            )
            return idx_to_wnid, wnid_to_classes
    def check_raw_file(self) -> bool:
@@ -177,7 +183,10 @@ class ImageNet(ImageFolder):
        val_wnids = [id2wnid[idx] for idx in val_idcs]
        val_images = sorted(
-            [os.path.join(self.target_folder, image) for image in os.listdir(self.target_folder)]
+            [
+                os.path.join(self.target_folder, image)
+                for image in os.listdir(self.target_folder)
+            ]
        )
        logger.debug("mkdir for val set wnids")
@@ -198,23 +207,24 @@ class ImageNet(ImageFolder):
        raw_filename, checksum = self.raw_file_meta["val"]
        raw_file = os.path.join(self.root, raw_filename)
        logger.info("checksum valid tar file {} ..".format(raw_file))
-        assert calculate_md5(raw_file) == checksum, \
+        assert (
-            "checksum mismatch, {} may be damaged".format(raw_file)
+            calculate_md5(raw_file) == checksum
+        ), "checksum mismatch, {} may be damaged".format(raw_file)
        logger.info("extract valid tar file.. this may take 10-20 minutes")
        untar(os.path.join(self.root, raw_file), self.target_folder)
        self._organize_val_data()
    def _prepare_train(self):
        assert self.train
        raw_filename, checksum = self.raw_file_meta["train"]
        raw_file = os.path.join(self.root, raw_filename)
        logger.info("checksum train tar file {} ..".format(raw_file))
-        assert calculate_md5(raw_file) == checksum, \
+        assert (
-            "checksum mismatch, {} may be damaged".format(raw_file)
+            calculate_md5(raw_file) == checksum
+        ), "checksum mismatch, {} may be damaged".format(raw_file)
        logger.info("extract train tar file.. this may take several hours")
        untar(
-            os.path.join(self.root, raw_file),
+            os.path.join(self.root, raw_file), self.target_folder,
-            self.target_folder,
        )
        paths = [
            os.path.join(self.target_folder, child_dir)
@@ -227,7 +237,8 @@ class ImageNet(ImageFolder):
        raw_filename, checksum = self.raw_file_meta["devkit"]
        raw_file = os.path.join(self.root, raw_filename)
        logger.info("checksum devkit tar file {} ..".format(raw_file))
-        assert calculate_md5(raw_file) == checksum, \
+        assert (
-            "checksum mismatch, {} may be damaged".format(raw_file)
+            calculate_md5(raw_file) == checksum
+        ), "checksum mismatch, {} may be damaged".format(raw_file)
        logger.info("extract devkit file..")
        untargz(os.path.join(self.root, self.raw_file_meta["devkit"][0]))
--- a/python_module/megengine/data/dataset/vision/utils.py
+++ b/python_module/megengine/data/dataset/vision/utils.py
@@ -7,8 +7,8 @@
 # software distributed under the License is distributed on an
 # "AS IS" BASIS, WITHOUT ARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 import hashlib
-import tarfile
 import os
+import tarfile
 from ....distributed.util import is_distributed
 from ....logger import get_logger

--- a/python_module/megengine/functional/elemwise.py
+++ b/python_module/megengine/functional/elemwise.py
@@ -46,16 +46,16 @@ __all__ = [
 def _elemwise(mode):  # DONT export
    """Decorator helps to wrap megbrain element-wise oprs"""
    def elemwise_decorator(func):
        @functools.wraps(func)
        @wrap_io_tensor
        def elemwise_func(*inputs) -> Tensor:
-            if all(isinstance(i, (int,float)) for i in inputs):
+            if all(isinstance(i, (int, float)) for i in inputs):
                device, comp_graph = _use_default_if_none(None, None)
-                ret = mgb.opr.elemwise(*inputs,
+                ret = mgb.opr.elemwise(
-                                       mode=mode,
+                    *inputs, mode=mode, comp_node=device, comp_graph=comp_graph
-                                       comp_node=device,
+                )
-                                       comp_graph=comp_graph)
                return ret.inferred_value[0]
            return mgb.opr.elemwise(*inputs, mode=mode)

--- a/python_module/megengine/module/__init__.py
+++ b/python_module/megengine/module/__init__.py
@@ -14,6 +14,6 @@ from .embedding import Embedding
 from .identity import Identity
 from .linear import Linear
 from .module import Module
+from .parampack import ParamPack
 from .pooling import AvgPool2d, MaxPool2d
 from .sequential import Sequential
-from .parampack import ParamPack
--- a/python_module/megengine/module/init.py
+++ b/python_module/megengine/module/init.py
@@ -12,7 +12,7 @@ from typing import Optional, Tuple, Union
 import numpy as np
-from ..core import Tensor, Graph
+from ..core import Graph, Tensor
 from ..random import gaussian, uniform

--- a/python_module/megengine/module/module.py
+++ b/python_module/megengine/module/module.py
@@ -168,10 +168,9 @@ class Module(metaclass=ABCMeta):
        """
        yield from self._flatten(predicate=_is_buffer, recursive=recursive)
-    def replace_param(self,
+    def replace_param(
-                      params: dict,
+        self, params: dict, start_pos: int, seen: Optional[Set[int]] = None
-                      start_pos: int,
+    ):
-                      seen: Optional[Set[int]] = None):
        offset = 0
        if seen is None:
            seen = set([id(self)])
@@ -183,12 +182,13 @@ class Module(metaclass=ABCMeta):
            seen.add(hash_id)
            if isinstance(module_dict[key], Parameter):
                if start_pos + offset in params:
-                    assert module_dict[key].shape == params[start_pos +
+                    assert module_dict[key].shape == params[start_pos + offset].shape
-                                                            offset].shape
                    module_dict[key] = params[start_pos + offset]
                offset += 1
            if isinstance(module_dict[key], Module):
-                offset += module_dict[key].replace_param(params, start_pos + offset, seen)
+                offset += module_dict[key].replace_param(
+                    params, start_pos + offset, seen
+                )
        return offset
    def named_buffers(

--- a/python_module/megengine/module/parampack.py
+++ b/python_module/megengine/module/parampack.py
@@ -8,11 +8,12 @@
 # "AS IS" BASIS, WITHOUT ARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 import collections
 from typing import Iterable, Optional
 import numpy as np
+from .._internal.opr import param_pack_split
 from ..core import Parameter, Tensor
 from .module import Module
-from .._internal.opr import param_pack_split
 class ParamPack(Module):
@@ -24,11 +25,14 @@ class ParamPack(Module):
    :param max_nr_params_per_group: upper bound of the number of parameters of each group.
    """
-    def __init__(self,
-                 model: Module,
+    def __init__(
-                 nr_ignore_first:int = 8,
+        self,
-                 max_size_per_group: int = 10,
+        model: Module,
-                 max_nr_params_per_group: int = 100):
+        nr_ignore_first: int = 8,
+        max_size_per_group: int = 10,
+        max_nr_params_per_group: int = 100,
+    ):
        super().__init__()
        self._model = model
        self._nr_ignore_first = nr_ignore_first
@@ -52,11 +56,11 @@ class ParamPack(Module):
        for param in params:
            if self._nr_ignore_first > ignored:
                ignored += 1
-                self._grouped_params.append([{'tensor': param, 'id': param_id}])
+                self._grouped_params.append([{"tensor": param, "id": param_id}])
                self._packed_params.append(param)
            else:
                key = (param.dtype, param.device, param.requires_grad)
-                groups[key].append({'tensor': param, 'id': param_id})
+                groups[key].append({"tensor": param, "id": param_id})
            param_id += 1
        for (dtype, device, requires_grad) in groups.keys():
            dtype_sz = np.dtype(dtype).itemsize
@@ -75,33 +79,36 @@ class ParamPack(Module):
                idx = 0
                while idx < len(group):
                    param = group[idx]
-                    assert param['tensor'].device == device
+                    assert param["tensor"].device == device
                    padding = (align - (offset & (align - 1))) & (align - 1)
                    offset += padding
                    aligned_pos.append(offset)
                    params.append(param)
-                    offset += int(np.prod(param['tensor'].shape))
+                    offset += int(np.prod(param["tensor"].shape))
                    idx += 1
-                    if (offset * dtype_sz >=
+                    if (
-                            self._max_size_per_group * 1024 * 1024
+                        offset * dtype_sz >= self._max_size_per_group * 1024 * 1024
-                            or idx >= self._max_nr_params_per_group):
+                        or idx >= self._max_nr_params_per_group
+                    ):
                        break
                group = group[idx:]
                if idx == 1:
                    # ignore param packs with only one item
-                    self._packed_params.append(params[0]['tensor'])
+                    self._packed_params.append(params[0]["tensor"])
                    self._grouped_params.append(params)
                    continue
-                packed_value = np.zeros((offset, ), dtype=dtype)
+                packed_value = np.zeros((offset,), dtype=dtype)
                for param, pos in zip(params, aligned_pos):
-                    val = param['tensor'].numpy()
+                    val = param["tensor"].numpy()
-                    packed_value[pos:pos + val.size] = val.flatten()
+                    packed_value[pos : pos + val.size] = val.flatten()
-                new_param = Parameter(value=packed_value,
+                new_param = Parameter(
-                                      device=device,
+                    value=packed_value,
-                                      dtype=dtype,
+                    device=device,
-                                      requires_grad=requires_grad)
+                    dtype=dtype,
+                    requires_grad=requires_grad,
+                )
                self._packed_params.append(new_param)
                self._grouped_params.append(params)
@@ -112,14 +119,15 @@ class ParamPack(Module):
            grouped_params = self._grouped_params[i]
            if len(grouped_params) == 1:
                continue
-            split = param_pack_split(packed_param._symvar,
+            split = param_pack_split(
-                                     [i['tensor'].shape for i in grouped_params])
+                packed_param._symvar, [i["tensor"].shape for i in grouped_params]
+            )
            split = [
                Parameter(Tensor(i, requires_grad=packed_param.requires_grad))
                for i in split
            ]
            for j in range(len(split)):
-                replace_param[grouped_params[j]['id']] = split[j]
+                replace_param[grouped_params[j]["id"]] = split[j]
        self._model.replace_param(replace_param, 0)
        return self._model.forward(*args, **kwargs)
--- a/python_module/test/integration/test_parampack.py
+++ b/python_module/test/integration/test_parampack.py
@@ -75,10 +75,9 @@ class XORNet(Module):
 @pytest.mark.slow
 def test_static_graph_parampack():
    net = XORNet()
-    net = ParamPack(net,
+    net = ParamPack(
-                    nr_ignore_first=0,
+        net, nr_ignore_first=0, max_size_per_group=10, max_nr_params_per_group=100
-                    max_size_per_group=10,
+    )
-                    max_nr_params_per_group=100)
    opt = SGD(
        net.parameters(requires_grad=True), lr=0.01, momentum=0.9, weight_decay=5e-4
    )
@@ -110,12 +109,11 @@ def test_static_graph_parampack():
    pred = infer(data).numpy()
    assert calculate_precision(data, pred) > 0.95, "Test precision must be high enough"
 @pytest.mark.slow
 def test_nopack_parampack():
    net = XORNet()
-    net = ParamPack(net,
+    net = ParamPack(net, max_size_per_group=0, max_nr_params_per_group=0)
-                    max_size_per_group=0,
-                    max_nr_params_per_group=0)
    opt = SGD(
        net.parameters(requires_grad=True), lr=0.01, momentum=0.9, weight_decay=5e-4
    )
@@ -146,13 +144,13 @@ def test_nopack_parampack():
    pred = infer(data).numpy()
    assert calculate_precision(data, pred) > 0.95, "Test precision must be high enough"
 @pytest.mark.slow
 def test_dynamic_graph_parampack():
    net = XORNet()
-    net = ParamPack(net,
+    net = ParamPack(
-                    nr_ignore_first=0,
+        net, nr_ignore_first=0, max_size_per_group=10, max_nr_params_per_group=100
-                    max_size_per_group=10,
+    )
-                    max_nr_params_per_group=100)
    opt = SGD(
        net.parameters(requires_grad=True), lr=0.01, momentum=0.9, weight_decay=5e-4
    )
@@ -184,6 +182,7 @@ def test_dynamic_graph_parampack():
    pred = infer(data).numpy()
    assert calculate_precision(data, pred) > 0.95, "Test precision must be high enough"
 @pytest.mark.slow
 def test_correctness_parampack():
    net1 = XORNet()
@@ -192,10 +191,9 @@ def test_correctness_parampack():
    params2 = net2.parameters()
    for param1, param2 in zip(params1, params2):
        param1.set_value(param2.numpy())
-    net1 = ParamPack(net1,
+    net1 = ParamPack(
-                     nr_ignore_first=0,
+        net1, nr_ignore_first=0, max_size_per_group=10, max_nr_params_per_group=100
-                     max_size_per_group=10,
+    )
-                     max_nr_params_per_group=100)
    opt1 = SGD(
        net1.parameters(requires_grad=True), lr=0.01, momentum=0.9, weight_decay=5e-4
    )

--- a/python_module/test/unit/functional/test_elemwise.py
+++ b/python_module/test/unit/functional/test_elemwise.py
@@ -10,31 +10,37 @@ import numpy as np
 import megengine.functional as F
 from megengine import tensor
 from megengine.test import assertTensorClose
 def test_abs():
    assertTensorClose(
-        F.abs(tensor([-3., -4., -5.])).numpy(),
+        F.abs(tensor([-3.0, -4.0, -5.0])).numpy(),
-        np.abs(np.array([-3., -4., -5.], dtype=np.float32)))
+        np.abs(np.array([-3.0, -4.0, -5.0], dtype=np.float32)),
+    )
-    assertTensorClose(F.abs(-3.), np.abs(np.float32(-3.)))
+    assertTensorClose(F.abs(-3.0), np.abs(np.float32(-3.0)))
 def test_multiply():
-    assertTensorClose(F.multiply(-3., -4.),
+    assertTensorClose(
-                      np.multiply(np.float32(-3.), np.float32(-4.)))
+        F.multiply(-3.0, -4.0), np.multiply(np.float32(-3.0), np.float32(-4.0))
+    )
    assertTensorClose(
-        F.multiply(tensor([3., 4.]), 4.).numpy(),
+        F.multiply(tensor([3.0, 4.0]), 4.0).numpy(),
-        np.multiply(np.array([3., 4.], dtype=np.float32), 4.))
+        np.multiply(np.array([3.0, 4.0], dtype=np.float32), 4.0),
+    )
    assertTensorClose(
-        F.multiply(4., tensor([3., 4.])).numpy(),
+        F.multiply(4.0, tensor([3.0, 4.0])).numpy(),
-        np.multiply(4., np.array([3., 4.], dtype=np.float32)))
+        np.multiply(4.0, np.array([3.0, 4.0], dtype=np.float32)),
+    )
    assertTensorClose(
-        F.multiply(tensor([3., 4.]), tensor([3., 4.])).numpy(),
+        F.multiply(tensor([3.0, 4.0]), tensor([3.0, 4.0])).numpy(),
-        np.multiply(np.array([3., 4.], dtype=np.float32),
+        np.multiply(
-                    np.array([3., 4.], dtype=np.float32)))
+            np.array([3.0, 4.0], dtype=np.float32),
+            np.array([3.0, 4.0], dtype=np.float32),
+        ),
+    )
--- a/python_module/test/unit/jit/test_jit.py
+++ b/python_module/test/unit/jit/test_jit.py
@@ -15,10 +15,10 @@ import pytest
 import megengine as mge
 import megengine._internal as mgb
+import megengine.module as M
 from megengine import jit, tensor
 from megengine.core.tensor import Tensor
 from megengine.test import assertTensorClose
-import megengine.module as M
 @contextlib.contextmanager
@@ -158,13 +158,14 @@ def test_shape_infer():
 def test_dump_bn_fused():
    class ConvBNReLU(M.Sequential):
        def __init__(self):
            super(ConvBNReLU, self).__init__(
                M.Conv2d(3, 4, 3, 1, 1, groups=1, bias=False),
                M.BatchNorm2d(4),
-                M.ReLU())
+                M.ReLU(),
+            )
    net = ConvBNReLU()
    net.eval()
@@ -178,8 +179,9 @@ def test_dump_bn_fused():
        fun.dump(out, optimize_for_inference=True)
        cg, _, outputs = mgb.load_comp_graph_from_file(out)
-    out, = outputs
+    (out,) = outputs
    inputs = mgb.cgtools.get_inputs(out)
    assert len(inputs) == 2 and (
-        mgb.cgtools.get_type(inputs[0]) == 'MultipleDeviceTensorHolder' and
+        mgb.cgtools.get_type(inputs[0]) == "MultipleDeviceTensorHolder"
-        mgb.cgtools.get_type(inputs[1]) == 'ConvolutionForward')
+        and mgb.cgtools.get_type(inputs[1]) == "ConvolutionForward"
+    )