metric learning one_hot api usage update according to paddle 1.8 (#4596)

* test=develop update one_hot usage according to 1.8 * test=develop update dataloader api by 1.8 * test=develop fix image shape

metric learning one_hot api usage update according to paddle 1.8 (#4596)
* test=develop update one_hot usage according to 1.8 * test=develop update dataloader api by 1.8 * test=develop fix image shape
56cfb006 · suytingwan · GitHub · 8633764a · 56cfb006 · 56cfb006
6 changed file
--- a/PaddleCV/metric_learning/eval.py
+++ b/PaddleCV/metric_learning/eval.py
@@ -52,8 +52,13 @@ def eval(args):
    assert model_name in model_list, "{} is not in lists: {}".format(args.model,
                                                                     model_list)
-    image = fluid.layers.data(name='image', shape=image_shape, dtype='float32')
+    image = fluid.layers.data(name='image', shape=[None] + image_shape, dtype='float32')
-    label = fluid.layers.data(name='label', shape=[1], dtype='int64')
+    label = fluid.layers.data(name='label', shape=[None, 1], dtype='int64')
+    test_loader = fluid.io.DataLoader.from_generator(
+                feed_list=[image, label],
+                capacity=64,
+                use_double_buffer=True,
+                iterable=True)
    # model definition
    model = models.__dict__[model_name]()
@@ -72,16 +77,21 @@ def eval(args):
        fluid.io.load_vars(exe, pretrained_model, predicate=if_exist)
-    test_reader = paddle.batch(reader.test(args), batch_size=args.batch_size, drop_last=False)
+    test_loader.set_sample_generator(
-    feeder = fluid.DataFeeder(place=place, feed_list=[image, label])
+        reader.test(args),
+        batch_size=args.batch_size,
+        drop_last=False,
+        places=place)
    fetch_list = [out.name]
    f, l = [], []
-    for batch_id, data in enumerate(test_reader()):
+    for batch_id, data in enumerate(test_loader()):
        t1 = time.time()
-        [feas] = exe.run(test_program, fetch_list=fetch_list, feed=feeder.feed(data))
+        [feas] = exe.run(test_program, fetch_list=fetch_list, feed=data)
-        label = np.asarray([x[1] for x in data])
+        label = np.asarray(data[0]['label'])
+        label = np.squeeze(label)
        f.append(feas)
        l.append(label)

--- a/PaddleCV/metric_learning/infer.py
+++ b/PaddleCV/metric_learning/infer.py
@@ -51,7 +51,13 @@ def infer(args):
    assert model_name in model_list, "{} is not in lists: {}".format(args.model,
                                                                     model_list)
-    image = fluid.layers.data(name='image', shape=image_shape, dtype='float32')
+    image = fluid.layers.data(name='image', shape=[None] + image_shape, dtype='float32')
+    infer_loader = fluid.io.DataLoader.from_generator(
+                feed_list=[image],
+                capacity=64,
+                use_double_buffer=True,
+                iterable=True)
    # model definition
    model = models.__dict__[model_name]()
@@ -70,13 +76,16 @@ def infer(args):
        fluid.io.load_vars(exe, pretrained_model, predicate=if_exist)
-    infer_reader = paddle.batch(reader.infer(args), batch_size=args.batch_size, drop_last=False)
+    infer_loader.set_sample_generator(
-    feeder = fluid.DataFeeder(place=place, feed_list=[image])
+        reader.test(args),
+        batch_size=args.batch_size,
+        drop_last=False,
+        places=place)
    fetch_list = [out.name]
-    for batch_id, data in enumerate(infer_reader()):
+    for batch_id, data in enumerate(infer_loader()):
-        result = exe.run(test_program, fetch_list=fetch_list, feed=feeder.feed(data))
+        result = exe.run(test_program, fetch_list=fetch_list, feed=data)
        result = result[0][0].reshape(-1)
        print("Test-{0}-feature: {1}".format(batch_id, result[:5]))
        sys.stdout.flush()

--- a/PaddleCV/metric_learning/losses/arcmarginloss.py
+++ b/PaddleCV/metric_learning/losses/arcmarginloss.py
@@ -61,7 +61,8 @@ class ArcMarginLoss():
        else:
            phi = self.paddle_where_more_than(cosine, th, phi, cosine-mm)
-        one_hot = fluid.layers.one_hot(input=label, depth=out_dim)
+        one_hot = fluid.one_hot(input=label, depth=out_dim)
+        one_hot = fluid.layers.squeeze(input=one_hot, axes=[1])
        output = fluid.layers.elementwise_mul(one_hot, phi) + fluid.layers.elementwise_mul((1.0 - one_hot), cosine)
        output = output * s
        return output

--- a/PaddleCV/metric_learning/reader.py
+++ b/PaddleCV/metric_learning/reader.py
@@ -22,6 +22,7 @@ import functools
 import numpy as np
 import paddle
 from imgtool import process_image
+import paddle.fluid as fluid
 random.seed(0)
@@ -187,7 +188,7 @@ def createreader(settings, mode):
    keep_order = False if mode != 'train' or settings.loss_name in ['softmax', 'arcmargin'] else True
    image_mapper = functools.partial(process_image,
            mode=mode, color_jitter=False, rotate=False, crop_size=image_size)
-    reader = paddle.reader.xmap_readers(
+    reader = fluid.io.xmap_readers(
            image_mapper, metric_reader, 8, 1000, order=keep_order)
    return reader

--- a/PaddleCV/metric_learning/train_elem.py
+++ b/PaddleCV/metric_learning/train_elem.py
@@ -107,19 +107,16 @@ def build_program(is_train, main_prog, startup_prog, args):
    image_shape = [int(m) for m in args.image_shape.split(",")]
    model = models.__dict__[args.model]()
    with fluid.program_guard(main_prog, startup_prog):
-        if is_train:
        queue_capacity = 64
-            py_reader = fluid.layers.py_reader(
-                capacity=queue_capacity,
-                shapes=[[-1] + image_shape, [-1, 1]],
-                lod_levels=[0, 0],
-                dtypes=["float32", "int64"],
-                use_double_buffer=True)
-            image, label = fluid.layers.read_file(py_reader)
-        else:
        image = fluid.layers.data(
-                name='image', shape=image_shape, dtype='float32')
+                name='image', shape=[None] + image_shape, dtype='float32')
-            label = fluid.layers.data(name='label', shape=[1], dtype='int64')
+        label = fluid.layers.data(
+                name='label', shape=[None, 1], dtype='int64')
+        loader = fluid.io.DataLoader.from_generator(
+                feed_list=[image, label],
+                capacity=queue_capacity,
+                use_double_buffer=True,
+                iterable=True)
        with fluid.unique_name.guard():
            avg_cost, acc_top1, acc_top5, out = net_config(image, label, model,
@@ -137,9 +134,9 @@ def build_program(is_train, main_prog, startup_prog, args):
        main_prog = main_prog.clone(for_test=True)
    """
    if is_train:
-        return py_reader, avg_cost, acc_top1, acc_top5, global_lr
+        return loader, avg_cost, acc_top1, acc_top5, global_lr
    else:
-        return out, image, label
+        return loader, out
 def train_async(args):
@@ -163,12 +160,12 @@ def train_async(args):
        train_prog.random_seed = 1000
        tmp_prog.random_seed = 1000
-    train_py_reader, train_cost, train_acc1, train_acc5, global_lr = build_program(
+    train_loader, train_cost, train_acc1, train_acc5, global_lr = build_program(
        is_train=True,
        main_prog=train_prog,
        startup_prog=startup_prog,
        args=args)
-    test_feas, image, label = build_program(
+    test_loader, test_feas = build_program(
        is_train=False,
        main_prog=tmp_prog,
        startup_prog=startup_prog,
@@ -182,6 +179,11 @@ def train_async(args):
    place = fluid.CUDAPlace(0) if args.use_gpu else fluid.CPUPlace()
    exe = fluid.Executor(place)
+    num_trainers = int(os.environ.get('PADDLE_TRAINERS_NUM', 1))
+    if num_trainers <= 1 and args.use_gpu:
+        places = fluid.framework.cuda_places()
+    else:
+        places = place
    exe.run(startup_prog)
@@ -206,12 +208,17 @@ def train_async(args):
    train_batch_size = args.train_batch_size // devicenum
    test_batch_size = args.test_batch_size
-    train_reader = paddle.batch(
+    train_loader.set_sample_generator(
-        reader.train(args), batch_size=train_batch_size, drop_last=True)
+        reader.train(args), 
-    test_reader = paddle.batch(
+        batch_size=train_batch_size,
-        reader.test(args), batch_size=test_batch_size, drop_last=False)
+        drop_last=True,
-    test_feeder = fluid.DataFeeder(place=place, feed_list=[image, label])
+        places=places)
-    train_py_reader.decorate_paddle_reader(train_reader)
+    test_loader.set_sample_generator(
+        reader.test(args),
+        batch_size=test_batch_size,
+        drop_last=False,
+        places=place)
    train_exe = fluid.ParallelExecutor(
        main_program=train_prog,
@@ -219,12 +226,14 @@ def train_async(args):
        loss_name=train_cost.name)
    totalruntime = 0
-    train_py_reader.start()
    iter_no = 0
    train_info = [0, 0, 0, 0]
    while iter_no <= args.total_iter_num:
+        for train_batch in train_loader():
            t1 = time.time()
-        lr, loss, acc1, acc5 = train_exe.run(fetch_list=train_fetch_list)
+            lr, loss, acc1, acc5 = train_exe.run(
+                                       feed=train_batch,
+                                       fetch_list=train_fetch_list)
            t2 = time.time()
            period = t2 - t1
            lr = np.mean(np.array(lr))
@@ -249,12 +258,14 @@ def train_async(args):
            if iter_no % args.test_iter_step == 0 and iter_no != 0:
                f, l = [], []
-            for batch_id, data in enumerate(test_reader()):
+                for batch_id, test_batch in enumerate(test_loader()):
                    t1 = time.time()
                    [feas] = exe.run(test_prog,
-                                 fetch_list=test_fetch_list,
+                                 feed=test_batch,
-                                 feed=test_feeder.feed(data))
+                                 fetch_list=test_fetch_list)
-                label = np.asarray([x[1] for x in data])
+                    label = np.asarray(test_batch[0]['label'])
+                    label = np.squeeze(label)
                    f.append(feas)
                    l.append(label)

--- a/PaddleCV/metric_learning/train_pair.py
+++ b/PaddleCV/metric_learning/train_pair.py
@@ -114,19 +114,16 @@ def build_program(is_train, main_prog, startup_prog, args):
    image_shape = [int(m) for m in args.image_shape.split(",")]
    model = models.__dict__[args.model]()
    with fluid.program_guard(main_prog, startup_prog):
-        if is_train:
        queue_capacity = 64
-            py_reader = fluid.layers.py_reader(
-                capacity=queue_capacity,
-                shapes=[[-1] + image_shape, [-1, 1]],
-                lod_levels=[0, 0],
-                dtypes=["float32", "int64"],
-                use_double_buffer=True)
-            image, label = fluid.layers.read_file(py_reader)
-        else:
        image = fluid.layers.data(
-                name='image', shape=image_shape, dtype='float32')
+                name='image', shape=[None] + image_shape, dtype='float32')
-            label = fluid.layers.data(name='label', shape=[1], dtype='int64')
+        label = fluid.layers.data(
+                name='label', shape=[None, 1], dtype='int64')
+        loader = fluid.io.DataLoader.from_generator(
+                feed_list=[image, label],
+                capacity=queue_capacity,
+                use_double_buffer=True,
+                iterable=True)
        with fluid.unique_name.guard():
            avg_cost, out = net_config(image, label, model, args, is_train)
@@ -143,9 +140,9 @@ def build_program(is_train, main_prog, startup_prog, args):
        main_prog = main_prog.clone(for_test=True)
    """
    if is_train:
-        return py_reader, avg_cost, global_lr, out, label
+        return loader, avg_cost, global_lr, out, label
    else:
-        return out, image, label
+        return loader, out
 def train_async(args):
@@ -161,12 +158,12 @@ def train_async(args):
    train_prog = fluid.Program()
    tmp_prog = fluid.Program()
-    train_py_reader, train_cost, global_lr, train_feas, train_label = build_program(
+    train_loader, train_cost, global_lr, train_feas, train_label = build_program(
        is_train=True,
        main_prog=train_prog,
        startup_prog=startup_prog,
        args=args)
-    test_feas, image, label = build_program(
+    test_loader, test_feas = build_program(
        is_train=False,
        main_prog=tmp_prog,
        startup_prog=startup_prog,
@@ -180,6 +177,11 @@ def train_async(args):
    place = fluid.CUDAPlace(0) if args.use_gpu else fluid.CPUPlace()
    exe = fluid.Executor(place)
+    num_trainers = int(os.environ.get('PADDLE_TRAINERS_NUM', 1))
+    if num_trainers <= 1 and args.use_gpu:
+        places = fluid.framework.cuda_places()
+    else:
+        places = place
    exe.run(startup_prog)
@@ -204,12 +206,17 @@ def train_async(args):
    train_batch_size = args.train_batch_size / devicenum
    test_batch_size = args.test_batch_size
-    train_reader = paddle.batch(
+    train_loader.set_sample_generator(
-        reader.train(args), batch_size=train_batch_size, drop_last=True)
+        reader.train(args), 
-    test_reader = paddle.batch(
+        batch_size=train_batch_size,
-        reader.test(args), batch_size=test_batch_size, drop_last=False)
+        drop_last=True,
-    test_feeder = fluid.DataFeeder(place=place, feed_list=[image, label])
+        places=places)
-    train_py_reader.decorate_paddle_reader(train_reader)
+    test_loader.set_sample_generator(
+        reader.test(args),
+        batch_size=test_batch_size,
+        drop_last=False,
+        places=place)
    train_exe = fluid.ParallelExecutor(
        main_program=train_prog,
@@ -217,12 +224,14 @@ def train_async(args):
        loss_name=train_cost.name)
    totalruntime = 0
-    train_py_reader.start()
    iter_no = 0
    train_info = [0, 0, 0]
    while iter_no <= args.total_iter_num:
+        for train_batch in train_loader():
            t1 = time.time()
-        lr, loss, feas, label = train_exe.run(fetch_list=train_fetch_list)
+            lr, loss, feas, label = train_exe.run(
+                                        feed=train_batch,
+                                        fetch_list=train_fetch_list)
            t2 = time.time()
            period = t2 - t1
            lr = np.mean(np.array(lr))
@@ -245,12 +254,14 @@ def train_async(args):
            if iter_no % args.test_iter_step == 0 and iter_no != 0:
                f, l = [], []
-            for batch_id, data in enumerate(test_reader()):
+                for batch_id, test_batch in enumerate(test_loader()):
                    t1 = time.time()
                    [feas] = exe.run(test_prog,
-                                 fetch_list=test_fetch_list,
+                                 feed=test_batch,
-                                 feed=test_feeder.feed(data))
+                                 fetch_list=test_fetch_list)
-                label = np.asarray([x[1] for x in data])
+                    label = np.asarray(test_batch[0]['label'])
+                    label = np.squeeze(label)
                    f.append(feas)
                    l.append(label)