delete the redundant argument while initializing class of GradOperation

d57960ed · shibeiji · 7371cedd · d57960ed · d57960ed
Showing with 4 addition and 5 deletion

model_zoo/official/nlp/bert/run_pretrain.py model_zoo/official/nlp/bert/run_pretrain.py +3 -2

model_zoo/official/nlp/bert/src/bert_for_pre_training.py model_zoo/official/nlp/bert/src/bert_for_pre_training.py +1 -3

未找到文件。
--- a/model_zoo/official/nlp/bert/run_pretrain.py
+++ b/model_zoo/official/nlp/bert/run_pretrain.py
@@ -121,9 +121,10 @@ def run_pretrain():
    new_repeat_count = args_opt.epoch_size * ds.get_dataset_size() // args_opt.data_sink_steps
    if args_opt.train_steps > 0:
-        new_repeat_count = min(new_repeat_count, args_opt.train_steps // args_opt.data_sink_steps)
+        train_steps = args_opt.train_steps * args_opt.accumulation_steps
+        new_repeat_count = min(new_repeat_count, train_steps // args_opt.data_sink_steps)
    else:
-        args_opt.train_steps = args_opt.epoch_size * ds.get_dataset_size()
+        args_opt.train_steps = args_opt.epoch_size * ds.get_dataset_size() // args_opt.accumulation_steps
        logger.info("train steps: {}".format(args_opt.train_steps))
    if cfg.optimizer == 'Lamb':

--- a/model_zoo/official/nlp/bert/src/bert_for_pre_training.py
+++ b/model_zoo/official/nlp/bert/src/bert_for_pre_training.py
@@ -487,9 +487,7 @@ class BertTrainAccumulateStepsWithLossScaleCell(nn.Cell):
        self.accu_overflow = Parameter(initializer(0, [1], mstype.int32), name="accu_overflow")
        self.loss = Parameter(initializer(0, [1], mstype.float32), name="accu_loss")
-        self.grad = C.GradOperation('grad',
+        self.grad = C.GradOperation(get_by_list=True, sens_param=True)
-                                    get_by_list=True,
-                                    sens_param=True)
        self.reducer_flag = False
        self.parallel_mode = context.get_auto_parallel_context("parallel_mode")
        if self.parallel_mode in [ParallelMode.DATA_PARALLEL, ParallelMode.HYBRID_PARALLEL]: