From d4d6457ea79872cbb826bd049b5fec312daf4051 Mon Sep 17 00:00:00 2001
From: Wei Luning <weiluning@huawei.com>
Date: Tue, 4 Aug 2020 20:37:16 +0800
Subject: [PATCH] init parameter data by defaultOnly keep no data as MetaTensor
 in auto parallel mode

---
 mindspore/common/api.py                       |  4 ++
 mindspore/common/parameter.py                 | 42 +++++++++----------
 .../st/model_zoo_tests/yolov3/test_yolov3.py  |  1 -
 .../models/bert/test_bert_tdt_lossscale.py    |  2 -
 tests/ut/python/nn/test_parameter.py          | 12 ++++--
 .../test_optimizer_with_parameter_groups.py   | 16 +++----
 .../ut/python/pynative_mode/ops/test_grad.py  |  5 ++-
 7 files changed, 44 insertions(+), 38 deletions(-)

diff --git a/mindspore/common/api.py b/mindspore/common/api.py
index c0fa868f8..aba8f92e1 100644
--- a/mindspore/common/api.py
+++ b/mindspore/common/api.py
@@ -414,6 +414,10 @@ class _Executor:
         if auto_parallel_mode:
             obj.parameter_layout_dict = self._executor.get_parameter_layout(phase)
         replace = obj.init_parameters_data(auto_parallel_mode=auto_parallel_mode)
+        if not enable_debug_runtime or enable_ge:
+            if auto_parallel_mode:
+                obj.load_parameter_slice(None)
+
         self._updata_param_node_default_input(phase, replace)
 
         # set parallel inputs in sink mode
diff --git a/mindspore/common/parameter.py b/mindspore/common/parameter.py
index 63866e113..f29f3a0a5 100644
--- a/mindspore/common/parameter.py
+++ b/mindspore/common/parameter.py
@@ -15,25 +15,22 @@
 
 """Parameter for cell."""
 from copy import copy
-from mindspore import context
 from .._c_expression import ParamValue
 from . import dtype as mstype
 from .initializer import initializer, Initializer
 from .tensor import Tensor, MetaTensor
 from .._checkparam import _check_str_by_regular
 from ..parallel._tensor import _get_slice_index
+from ..parallel._auto_parallel_context import auto_parallel_context
 
 __all__ = ['Parameter', 'ParameterTuple']
 
 PARAMETER_NAME_DEFAULT = "Parameter"
 PARAMETER_NAME_PREFIX_MAX_LEN = 1024
 
-
-def _check_type(x):
-    """Check input data type"""
-    if not isinstance(x, Parameter):
-        raise ValueError("Should be `Parameter` collection.")
-    return True
+def _is_in_parallel_mode():
+    """Get parallel mode."""
+    return auto_parallel_context().get_parallel_mode() in ["semi_auto_parallel", "auto_parallel"]
 
 
 class Parameter(MetaTensor):
@@ -42,10 +39,10 @@ class Parameter(MetaTensor):
 
     After initialized `Parameter` is a subtype of `Tensor`.
 
-    In graph mode, if init `Parameter` by  a `Initializer`, the type of Parameter will be a `MetaTensor`
-    not a `Tensor`. `MetaTensor` only save the shape type info of a tensor with no memory usage. The shape
-    can be change while compile for auto-parallel. Call `init_data` will return a Tensor Parameter with
-    initialized data.
+    In auto_parallel mode of  "semi_auto_parallel" and "auto_parallel", if init `Parameter` by
+    a `Initializer`, the type of Parameter will be a `MetaTensor` not a `Tensor`. `MetaTensor`
+    only save the shape type info of a tensor with no memory usage. The shape can be change while
+    compile for auto-parallel. Call `init_data` will return a Tensor Parameter with initialized data.
 
     Note:
         Each parameter of Cell is represented by Parameter class.
@@ -67,7 +64,7 @@ class Parameter(MetaTensor):
         input_class.__init__(obj, *class_init_args)
         # it's better to make the Initializer a kind of metatensor.
         obj.init_mode = None
-        if isinstance(default_input, Initializer):
+        if not isinstance(obj, Tensor):
             obj.init_mode = default_input
         return obj
 
@@ -112,11 +109,10 @@ class Parameter(MetaTensor):
         if isinstance(data, bool):
             raise ValueError('Parameter data can not be `bool`')
         if isinstance(data, Initializer):
-            if context.get_context("mode") == context.PYNATIVE_MODE:
-                # always init data while in pynative mode.
-                data = data.to_tensor()
-            else:
+            if _is_in_parallel_mode():
+                # do not init data while in auto parallel.
                 return (MetaTensor, data.dtype, data.shape)
+            data = data.to_tensor()
         if isinstance(data, Tensor):
             # make a copy of Tensor to init the parameter
             return (Tensor, data.asnumpy(),)
@@ -127,9 +123,9 @@ class Parameter(MetaTensor):
         return (Tensor, data)
 
     def __str__(self):
-        value_str = MetaTensor.__repr__(self)
+        value_str = MetaTensor.__str__(self)
         if isinstance(self, Tensor):
-            value_str = Tensor.__repr__(self)
+            value_str = Tensor.__str__(self)
         return f'Parameter (name={self._value.name}, value={value_str})'
 
     def __repr__(self):
@@ -235,8 +231,6 @@ class Parameter(MetaTensor):
             shape = self.shape
             dtype = self.dtype
             x.default_input = initializer(init, shape=shape, dtype=dtype)
-            if context.get_context("mode") == context.PYNATIVE_MODE:
-                x.init_data()
         return x
 
     @property
@@ -381,8 +375,12 @@ class ParameterTuple(tuple):
     """
     def __new__(cls, iterable):
         """Create instance object of ParameterTuple."""
-        g = (x for x in iterable if _check_type(x))
-        return tuple.__new__(ParameterTuple, g)
+        data = tuple(iterable)
+        for x in data:
+            if not isinstance(x, Parameter):
+                raise TypeError(f"ParameterTuple input should be `Parameter` collection."
+                                f"But got a {type(iterable)}, {iterable}")
+        return tuple.__new__(ParameterTuple, tuple(data))
 
     def clone(self, prefix, init='same'):
         """
diff --git a/tests/st/model_zoo_tests/yolov3/test_yolov3.py b/tests/st/model_zoo_tests/yolov3/test_yolov3.py
index 25f15d179..f95e91309 100644
--- a/tests/st/model_zoo_tests/yolov3/test_yolov3.py
+++ b/tests/st/model_zoo_tests/yolov3/test_yolov3.py
@@ -120,7 +120,6 @@ def test_yolov3():
 
         net = yolov3_resnet18(ConfigYOLOV3ResNet18())
         net = YoloWithLossCell(net, ConfigYOLOV3ResNet18())
-        init_net_param(net)
 
         total_epoch_size = 60
         lr = Tensor(get_lr(learning_rate=lr_init, start_step=0,
diff --git a/tests/st/networks/models/bert/test_bert_tdt_lossscale.py b/tests/st/networks/models/bert/test_bert_tdt_lossscale.py
index 3c41f4dd7..150bc0fd4 100644
--- a/tests/st/networks/models/bert/test_bert_tdt_lossscale.py
+++ b/tests/st/networks/models/bert/test_bert_tdt_lossscale.py
@@ -207,7 +207,6 @@ def test_bert_percision():
     netwithgrads.set_train(True)
     model = Model(netwithgrads)
     callback = ModelCallback()
-    netwithloss.init_parameters_data()
     params = netwithloss.trainable_params()
     for param in params:
         value = param.default_input
@@ -279,7 +278,6 @@ def test_bert_performance():
     netwithgrads.set_train(True)
     model = Model(netwithgrads)
     callback = ModelCallback()
-    netwithloss.init_parameters_data()
     params = netwithloss.trainable_params()
     for param in params:
         value = param.default_input
diff --git a/tests/ut/python/nn/test_parameter.py b/tests/ut/python/nn/test_parameter.py
index 75d03eda9..f4ab8734f 100644
--- a/tests/ut/python/nn/test_parameter.py
+++ b/tests/ut/python/nn/test_parameter.py
@@ -17,7 +17,7 @@
 import numpy as np
 import pytest
 
-from mindspore import Tensor, Parameter, ParameterTuple
+from mindspore import context, Tensor, Parameter, ParameterTuple
 from mindspore._checkparam import _check_str_by_regular
 from mindspore.common import dtype as mstype
 from mindspore.common.initializer import initializer
@@ -43,11 +43,11 @@ def test_parameter_tuple_illegal():
     ParameterTuple(ptuple)
     with pytest.raises(TypeError):
         ParameterTuple(p1)
-    with pytest.raises(ValueError):
+    with pytest.raises(TypeError):
         ParameterTuple(plist2)
-    with pytest.raises(ValueError):
+    with pytest.raises(TypeError):
         ParameterTuple(ptuple_str)
-    with pytest.raises(ValueError):
+    with pytest.raises(TypeError):
         ParameterTuple(pstr)
     with pytest.raises(TypeError):
         ParameterTuple(pnum)
@@ -136,6 +136,9 @@ def test_check_str_by_regular():
         _check_str_by_regular(str6)
 
 def test_parameter_lazy_init():
+    # support lazy init in SEMI_AUTO_PARALLEL mode
+    context.reset_auto_parallel_context()
+    context.set_auto_parallel_context(parallel_mode="semi_auto_parallel", device_num=8)
     # Call init_data() without set default_input.
     para = Parameter(initializer('ones', [1, 2, 3], mstype.float32), 'test1')
     assert not isinstance(para.default_input, Tensor)
@@ -167,3 +170,4 @@ def test_parameter_lazy_init():
     # expect no effect.
     para.init_data()
     assert np.array_equal(para.default_input.asnumpy(), np.ones((1, 2, 3)))
+    context.reset_auto_parallel_context()
diff --git a/tests/ut/python/optimizer/test_optimizer_with_parameter_groups.py b/tests/ut/python/optimizer/test_optimizer_with_parameter_groups.py
index 19b82e16e..fccccafb0 100644
--- a/tests/ut/python/optimizer/test_optimizer_with_parameter_groups.py
+++ b/tests/ut/python/optimizer/test_optimizer_with_parameter_groups.py
@@ -71,7 +71,7 @@ def test_group_lr():
     assert opt.dynamic_lr is False
     assert opt.is_group_params_ordered is True
     for lr, param, order_param in zip(opt.learning_rate, opt.parameters, net.trainable_params()):
-        if param in conv_params:
+        if 'conv' in param.name:
             assert np.all(lr.data.asnumpy() == Tensor(conv_lr, mstype.float32).asnumpy())
         else:
             assert np.all(lr.data.asnumpy() == Tensor(default_lr, mstype.float32).asnumpy())
@@ -103,7 +103,7 @@ def test_group_dynamic_1():
     assert opt.dynamic_lr is True
     assert opt.is_group_params_ordered is True
     for lr, param, order_param in zip(opt.learning_rate, opt.parameters, net.trainable_params()):
-        if param in conv_params:
+        if 'conv' in param.name:
             assert np.all(lr.learning_rate.data.asnumpy() == \
                           Tensor(np.array([conv_lr] * 3).astype(np.float32)).asnumpy())
         else:
@@ -135,7 +135,7 @@ def test_group_dynamic_2():
     assert opt.is_group is True
     assert opt.dynamic_lr is True
     for lr, param in zip(opt.learning_rate, opt.parameters):
-        if param in conv_params:
+        if 'conv' in param.name:
             assert np.all(lr.learning_rate.data.asnumpy() == \
                           Tensor(np.array(list(conv_lr)).astype(np.float32)).asnumpy())
         else:
@@ -203,7 +203,7 @@ def test_weight_decay():
     assert opt.is_group_params_ordered is True
     for weight_decay, decay_flags, param, order_param in zip(
             opt.weight_decay, opt.decay_flags, opt.parameters, net.trainable_params()):
-        if param in conv_params:
+        if 'conv' in param.name:
             assert weight_decay == conv_weight_decay
             assert decay_flags is True
         else:
@@ -303,11 +303,11 @@ def test_order_params_1():
     assert opt.is_group_params_ordered is True
     for weight_decay, decay_flags, lr, param, order_param in zip(
             opt.weight_decay, opt.decay_flags, opt.learning_rate, opt.parameters, bias_params+conv_params):
-        if param in conv_params:
+        if 'conv' in param.name:
             assert np.all(lr.data.asnumpy() == Tensor(0.1, mstype.float32).asnumpy())
             assert weight_decay == 0.01
             assert decay_flags is True
-        elif param in bias_params:
+        elif 'bias' in param.name:
             assert np.all(lr.data.asnumpy() == Tensor(0.01, mstype.float32).asnumpy())
             assert weight_decay == 0.0
             assert decay_flags is False
@@ -342,11 +342,11 @@ def test_order_params_2():
     all_lr = opt.get_lr_parameter(fc1_params+conv_params)
     for weight_decay, decay_flags, lr, param, order_param in zip(
             opt.weight_decay, opt.decay_flags, all_lr, opt.parameters, fc1_params+conv_params):
-        if param in conv_params:
+        if 'conv' in param.name:
             assert np.all(lr.data.asnumpy() == Tensor(np.array([default_lr] * 3), mstype.float32).asnumpy())
             assert weight_decay == conv_weight_decay
             assert decay_flags is True
-        elif param in fc1_params:
+        elif 'fc1' in param.name:
             assert np.all(lr.data.asnumpy() == Tensor(fc1_lr, mstype.float32).asnumpy())
             assert weight_decay == default_wd
             assert decay_flags is False
diff --git a/tests/ut/python/pynative_mode/ops/test_grad.py b/tests/ut/python/pynative_mode/ops/test_grad.py
index 0073965c3..475b48f52 100644
--- a/tests/ut/python/pynative_mode/ops/test_grad.py
+++ b/tests/ut/python/pynative_mode/ops/test_grad.py
@@ -17,7 +17,7 @@ import numpy as np
 
 import mindspore as ms
 import mindspore.ops.operations as P
-from mindspore import Tensor
+from mindspore import Tensor, context
 from mindspore.common.api import ms_function
 from mindspore.common.dtype import get_py_obj_dtype
 from mindspore.ops import composite as C
@@ -25,6 +25,9 @@ from mindspore.ops import functional as F
 from mindspore.ops.composite import grad_all_with_sens
 from ...ut_filter import non_graph_engine
 
+# pylint: disable=unused-argument
+def setup_module(module):
+    context.set_context(mode=context.PYNATIVE_MODE)
 
 def mul(x, y):
     return x * y
-- 
GitLab