fix resnet model for dygraph incompatible upgrade, test=develop (#4114)

c35c10a8 · zhongpu · hong · 1d50478e · c35c10a8
隐藏空白更改
内联并排

Showing with 37 addition and 37 deletion

dygraph/resnet/train.py dygraph/resnet/train.py +37 -37

未找到文件。
--- a/dygraph/resnet/train.py
+++ b/dygraph/resnet/train.py
@@ -18,7 +18,7 @@ import ast
 import paddle
 import paddle.fluid as fluid
 from paddle.fluid.layer_helper import LayerHelper
-from paddle.fluid.dygraph.nn import Conv2D, Pool2D, BatchNorm, FC
+from paddle.fluid.dygraph.nn import Conv2D, Pool2D, BatchNorm, Linear
 from paddle.fluid.dygraph.base import to_variable

 from paddle.fluid import framework
@@ -53,7 +53,7 @@ args = parse_args()
 batch_size = args.batch_size


-def optimizer_setting():
+def optimizer_setting(parameter_list=None):

    total_images = IMAGENET1000

@@ -64,28 +64,36 @@ def optimizer_setting():

    lr = []
    lr = [base_lr * (0.1**i) for i in range(len(bd) + 1)]
-    optimizer = fluid.optimizer.Momentum(
-        learning_rate=fluid.layers.piecewise_decay(
-            boundaries=bd, values=lr),
-        momentum=momentum_rate,
-        regularization=fluid.regularizer.L2Decay(l2_decay))
+    if fluid.in_dygraph_mode():
+        optimizer = fluid.optimizer.Momentum(
+            learning_rate=fluid.layers.piecewise_decay(
+                boundaries=bd, values=lr),
+            momentum=momentum_rate,
+            regularization=fluid.regularizer.L2Decay(l2_decay),
+            parameter_list=parameter_list)
+    else:
+        optimizer = fluid.optimizer.Momentum(
+            learning_rate=fluid.layers.piecewise_decay(
+                boundaries=bd, values=lr),
+            momentum=momentum_rate,
+            regularization=fluid.regularizer.L2Decay(l2_decay))
+        

    return optimizer


 class ConvBNLayer(fluid.dygraph.Layer):
    def __init__(self,
-                 name_scope,
                 num_channels,
                 num_filters,
                 filter_size,
                 stride=1,
                 groups=1,
                 act=None):
-        super(ConvBNLayer, self).__init__(name_scope)
+        super(ConvBNLayer, self).__init__()

        self._conv = Conv2D(
-            self.full_name(),
+            num_channels=num_channels,
            num_filters=num_filters,
            filter_size=filter_size,
            stride=stride,
@@ -94,7 +102,7 @@ class ConvBNLayer(fluid.dygraph.Layer):
            act=None,
            bias_attr=False)

-        self._batch_norm = BatchNorm(self.full_name(), num_filters, act=act)
+        self._batch_norm = BatchNorm(num_filters, act=act)

    def forward(self, inputs):
        y = self._conv(inputs)
@@ -105,28 +113,24 @@ class ConvBNLayer(fluid.dygraph.Layer):

 class BottleneckBlock(fluid.dygraph.Layer):
    def __init__(self,
-                 name_scope,
                 num_channels,
                 num_filters,
                 stride,
                 shortcut=True):
-        super(BottleneckBlock, self).__init__(name_scope)
+        super(BottleneckBlock, self).__init__()

        self.conv0 = ConvBNLayer(
-            self.full_name(),
            num_channels=num_channels,
            num_filters=num_filters,
            filter_size=1,
            act='relu')
        self.conv1 = ConvBNLayer(
-            self.full_name(),
            num_channels=num_filters,
            num_filters=num_filters,
            filter_size=3,
            stride=stride,
            act='relu')
        self.conv2 = ConvBNLayer(
-            self.full_name(),
            num_channels=num_filters,
            num_filters=num_filters * 4,
            filter_size=1,
@@ -134,7 +138,6 @@ class BottleneckBlock(fluid.dygraph.Layer):

        if not shortcut:
            self.short = ConvBNLayer(
-                self.full_name(),
                num_channels=num_channels,
                num_filters=num_filters * 4,
                filter_size=1,
@@ -161,8 +164,8 @@ class BottleneckBlock(fluid.dygraph.Layer):


 class ResNet(fluid.dygraph.Layer):
-    def __init__(self, name_scope, layers=50, class_dim=102):
-        super(ResNet, self).__init__(name_scope)
+    def __init__(self, layers=50, class_dim=102):
+        super(ResNet, self).__init__()

        self.layers = layers
        supported_layers = [50, 101, 152]
@@ -175,47 +178,46 @@ class ResNet(fluid.dygraph.Layer):
            depth = [3, 4, 23, 3]
        elif layers == 152:
            depth = [3, 8, 36, 3]
+        num_channels = [64, 256, 512, 1024]
        num_filters = [64, 128, 256, 512]

        self.conv = ConvBNLayer(
-            self.full_name(),
            num_channels=3,
            num_filters=64,
            filter_size=7,
            stride=2,
            act='relu')
        self.pool2d_max = Pool2D(
-            self.full_name(),
            pool_size=3,
            pool_stride=2,
            pool_padding=1,
            pool_type='max')

        self.bottleneck_block_list = []
-        num_channels = 64
        for block in range(len(depth)):
            shortcut = False
            for i in range(depth[block]):
                bottleneck_block = self.add_sublayer(
                    'bb_%d_%d' % (block, i),
                    BottleneckBlock(
-                        self.full_name(),
-                        num_channels=num_channels,
+                        num_channels=num_channels[block]
+                        if i == 0 else num_filters[block] * 4,
                        num_filters=num_filters[block],
                        stride=2 if i == 0 and block != 0 else 1,
                        shortcut=shortcut))
-                num_channels = bottleneck_block._num_channels_out
                self.bottleneck_block_list.append(bottleneck_block)
                shortcut = True

        self.pool2d_avg = Pool2D(
-            self.full_name(), pool_size=7, pool_type='avg', global_pooling=True)
+            pool_size=7, pool_type='avg', global_pooling=True)
+
+        self.pool2d_avg_output = num_filters[len(num_filters) - 1] * 4 * 1 * 1

        import math
        stdv = 1.0 / math.sqrt(2048 * 1.0)

-        self.out = FC(self.full_name(),
-                      size=class_dim,
+        self.out = Linear(self.pool2d_avg_output,
+                      class_dim,
                      act='softmax',
                      param_attr=fluid.param_attr.ParamAttr(
                          initializer=fluid.initializer.Uniform(-stdv, stdv)))
@@ -226,6 +228,7 @@ class ResNet(fluid.dygraph.Layer):
        for bottleneck_block in self.bottleneck_block_list:
            y = bottleneck_block(y)
        y = self.pool2d_avg(y)
+        y = fluid.layers.reshape(y, shape=[-1, self.pool2d_avg_output])
        y = self.out(y)
        return y

@@ -265,16 +268,13 @@ def eval(model, data):

        # print("epoch id: %d, batch step: %d, loss: %f" % (eop, batch_id, dy_out))
        if batch_id % 10 == 0:
-            print("test | batch step %d, loss %0.3f acc1 %0.3f acc5 %0.3f" % \
-                  ( batch_id, total_loss / total_sample, \
-                   total_acc1 / total_sample, total_acc5 / total_sample))
+            print("test | batch step %d, acc1 %0.3f acc5 %0.3f" % \
+                  ( batch_id, total_acc1 / total_sample, total_acc5 / total_sample))
    if args.ce:
        print("kpis\ttest_acc1\t%0.3f" % (total_acc1 / total_sample))
        print("kpis\ttest_acc5\t%0.3f" % (total_acc5 / total_sample))
-        print("kpis\ttest_loss\t%0.3f" % (total_loss / total_sample))
-    print("final eval loss %0.3f acc1 %0.3f acc5 %0.3f" % \
-          (total_loss / total_sample, \
-           total_acc1 / total_sample, total_acc5 / total_sample))
+    print("final eval acc1 %0.3f acc5 %0.3f" % \
+          (total_acc1 / total_sample, total_acc5 / total_sample))


 def train_resnet():
@@ -292,8 +292,8 @@ def train_resnet():
        if args.use_data_parallel:
            strategy = fluid.dygraph.parallel.prepare_context()

-        resnet = ResNet("resnet")
-        optimizer = optimizer_setting()
+        resnet = ResNet()
+        optimizer = optimizer_setting(parameter_list=resnet.parameters())

        if args.use_data_parallel:
            resnet = fluid.dygraph.parallel.DataParallel(resnet, strategy)