support zero dim tensor (#2116)

Co-authored-by: N wuzewu <wuzewu@baidu.com>

support zero dim tensor (#2116)
Co-authored-by: N wuzewu <wuzewu@baidu.com>
f84a7383 · chenjian · GitHub · 161f5814 · f84a7383 · f84a7383
隐藏空白更改
内联并排

Showing with 58 addition and 41 deletion

demo/autoaug/paddlehub_utils/trainer.py demo/autoaug/paddlehub_utils/trainer.py +29 -16

paddlehub/finetune/trainer.py paddlehub/finetune/trainer.py +29 -25

未找到文件。
--- a/demo/autoaug/paddlehub_utils/trainer.py
+++ b/demo/autoaug/paddlehub_utils/trainer.py
@@ -9,17 +9,19 @@
 Authors: lvhaijun01@baidu.com
 Date:     2020-11-24 20:46
 """
-
-from paddlehub.finetune.trainer import Trainer
 import os
 from collections import defaultdict
+
 import paddle
 from paddle.distributed import ParallelEnv
+
+from paddlehub.finetune.trainer import Trainer
 from paddlehub.utils.log import logger
 from paddlehub.utils.utils import Timer


 class CustomTrainer(Trainer):
+
    def __init__(self, **kwargs) -> None:
        super(CustomTrainer, self).__init__(**kwargs)

@@ -39,10 +41,15 @@ class CustomTrainer(Trainer):
        place = paddle.CUDAPlace(ParallelEnv().dev_id) if use_gpu else paddle.CPUPlace()
        paddle.disable_static(place)

-        batch_sampler = paddle.io.DistributedBatchSampler(
-            train_dataset, batch_size=batch_size, shuffle=True, drop_last=False)
-        loader = paddle.io.DataLoader(
-            train_dataset, batch_sampler=batch_sampler, places=place, num_workers=num_workers, return_list=True)
+        batch_sampler = paddle.io.DistributedBatchSampler(train_dataset,
+                                                          batch_size=batch_size,
+                                                          shuffle=True,
+                                                          drop_last=False)
+        loader = paddle.io.DataLoader(train_dataset,
+                                      batch_sampler=batch_sampler,
+                                      places=place,
+                                      num_workers=num_workers,
+                                      return_list=True)
        return batch_sampler, loader

    def train_one_epoch(self, loader: paddle.io.DataLoader, timer: Timer, current_epoch: int, epochs: int,
@@ -57,9 +64,9 @@ class CustomTrainer(Trainer):
            self.optimizer_zero_grad(current_epoch, batch_idx, self.optimizer)

            # calculate metrics and loss
-            avg_loss += loss.numpy()[0]
+            avg_loss += float(loss)
            for metric, value in metrics.items():
-                avg_metrics[metric] += value.numpy()[0]
+                avg_metrics[metric] += float(value)

            timer.count()

@@ -127,8 +134,9 @@ class CustomTrainer(Trainer):
                            self.log_writer.add_scalar(tag='EVAL/loss', step=timer.current_step, value=eval_loss)

                        for metric, value in eval_metrics.items():
-                            self.log_writer.add_scalar(
-                                tag='EVAL/{}'.format(metric), step=timer.current_step, value=value)
+                            self.log_writer.add_scalar(tag='EVAL/{}'.format(metric),
+                                                       step=timer.current_step,
+                                                       value=value)

                    if not self.best_metrics or self.compare_metrics(self.best_metrics, eval_metrics):
                        self.best_metrics = eval_metrics
@@ -147,11 +155,16 @@ class CustomTrainer(Trainer):
        place = paddle.CUDAPlace(ParallelEnv().dev_id) if use_gpu else paddle.CPUPlace()
        paddle.disable_static(place)

-        batch_sampler = paddle.io.DistributedBatchSampler(
-            eval_dataset, batch_size=batch_size, shuffle=False, drop_last=False)
+        batch_sampler = paddle.io.DistributedBatchSampler(eval_dataset,
+                                                          batch_size=batch_size,
+                                                          shuffle=False,
+                                                          drop_last=False)

-        loader = paddle.io.DataLoader(
-            eval_dataset, batch_sampler=batch_sampler, places=place, num_workers=num_workers, return_list=True)
+        loader = paddle.io.DataLoader(eval_dataset,
+                                      batch_sampler=batch_sampler,
+                                      places=place,
+                                      num_workers=num_workers,
+                                      return_list=True)
        return loader

    def evaluate_process(self, loader: paddle.io.DataLoader) -> dict:
@@ -168,10 +181,10 @@ class CustomTrainer(Trainer):
            num_samples += bs

            if loss:
-                avg_loss += loss.numpy()[0] * bs
+                avg_loss += float(loss) * bs

            for metric, value in metrics.items():
-                sum_metrics[metric] += value.numpy()[0] * bs
+                sum_metrics[metric] += float(value) * bs

        # print avg metrics and loss
        print_msg = '[Evaluation result]'

--- a/paddlehub/finetune/trainer.py
+++ b/paddlehub/finetune/trainer.py
@@ -11,15 +11,17 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-
 import os
 import pickle
 import time
 from collections import defaultdict
-from typing import Any, Callable, Generic, List
+from typing import Any
+from typing import Callable
+from typing import Generic
+from typing import List

-import paddle
 import numpy as np
+import paddle
 from visualdl import LogWriter

 from paddlehub.utils.log import logger
@@ -188,15 +190,16 @@ class Trainer(object):
            if not hasattr(model, 'validation_step'):
                raise NotImplementedError('The specified finetuning model does not support evaluation.')

-        batch_sampler = paddle.io.DistributedBatchSampler(
-            train_dataset, batch_size=batch_size, shuffle=True, drop_last=False)
-        loader = paddle.io.DataLoader(
-            train_dataset,
-            batch_sampler=batch_sampler,
-            num_workers=num_workers,
-            return_list=True,
-            use_buffer_reader=True,
-            collate_fn=collate_fn)
+        batch_sampler = paddle.io.DistributedBatchSampler(train_dataset,
+                                                          batch_size=batch_size,
+                                                          shuffle=True,
+                                                          drop_last=False)
+        loader = paddle.io.DataLoader(train_dataset,
+                                      batch_sampler=batch_sampler,
+                                      num_workers=num_workers,
+                                      return_list=True,
+                                      use_buffer_reader=True,
+                                      collate_fn=collate_fn)

        steps_per_epoch = len(batch_sampler)
        timer = Timer(steps_per_epoch * epochs)
@@ -214,7 +217,7 @@ class Trainer(object):
                self.optimizer_zero_grad(self.current_epoch, batch_idx, self.optimizer)

                # calculate metrics and loss
-                avg_loss += loss.numpy()[0]
+                avg_loss += float(loss)
                for metric, value in metrics.items():
                    if isinstance(value, paddle.Tensor):
                        value = value.numpy()
@@ -235,8 +238,9 @@ class Trainer(object):
                    for metric, value in avg_metrics.items():
                        value /= log_interval
                        if self.use_vdl:
-                            self.log_writer.add_scalar(
-                                tag='TRAIN/{}'.format(metric), step=timer.current_step, value=value)
+                            self.log_writer.add_scalar(tag='TRAIN/{}'.format(metric),
+                                                       step=timer.current_step,
+                                                       value=value)
                        if isinstance(value, np.ndarray):
                            value = value.item()
                        print_msg += ' {}={:.4f}'.format(metric, value)
@@ -258,8 +262,9 @@ class Trainer(object):
                                self.log_writer.add_scalar(tag='EVAL/loss', step=timer.current_step, value=eval_loss)

                            for metric, value in eval_metrics.items():
-                                self.log_writer.add_scalar(
-                                    tag='EVAL/{}'.format(metric), step=timer.current_step, value=value)
+                                self.log_writer.add_scalar(tag='EVAL/{}'.format(metric),
+                                                           step=timer.current_step,
+                                                           value=value)

                        if not self.best_metrics or self.compare_metrics(self.best_metrics, eval_metrics):
                            self.best_metrics = eval_metrics
@@ -293,15 +298,14 @@ class Trainer(object):
        if self.local_rank == 0:
            batch_sampler = paddle.io.BatchSampler(eval_dataset, batch_size=batch_size, shuffle=False, drop_last=False)

-            loader = paddle.io.DataLoader(
-                eval_dataset,
-                batch_sampler=batch_sampler,
-                num_workers=num_workers,
-                return_list=True,
-                collate_fn=collate_fn)
+            loader = paddle.io.DataLoader(eval_dataset,
+                                          batch_sampler=batch_sampler,
+                                          num_workers=num_workers,
+                                          return_list=True,
+                                          collate_fn=collate_fn)

            self.model.eval()
-            
+
            avg_loss = num_samples = 0
            sum_metrics = defaultdict(int)
            avg_metrics = defaultdict(int)
@@ -317,7 +321,7 @@ class Trainer(object):
                        num_samples += bs

                        if loss:
-                            avg_loss += loss.numpy()[0] * bs
+                            avg_loss += float(loss) * bs

                        for metric, value in metrics.items():
                            sum_metrics[metric] += value * bs