# Copyright (c) 2019  PaddlePaddle Authors. All Rights Reserved.
#
# Licensed under the Apache License, Version 2.0 (the "License"
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import numpy as np
import paddle.fluid as fluid
from paddle.fluid.param_attr import ParamAttr
from .search_space_base import SearchSpaceBase
from .base_layer import conv_bn_layer
from .search_space_registry import SEARCHSPACE
from .utils import compute_downsample_num, check_points

__all__ = ["ResNetBlockSpace"]


@SEARCHSPACE.register
class ResNetBlockSpace(SearchSpaceBase):
    def __init__(self, input_size, output_size, block_num, block_mask=None):
        super(ResNetBlockSpace, self).__init__(input_size, output_size,
                                               block_num, block_mask)
        # use input_size and output_size to compute self.downsample_num
        self.downsample_num = compute_downsample_num(self.input_size,
                                                     self.output_size)
        if self.block_num != None:
            assert self.downsample_num <= self.block_num, 'downsample numeber must be LESS THAN OR EQUAL TO block_num, but NOW: downsample numeber is {}, block_num is {}'.format(
                self.downsample_num, self.block_num)
        self.filter_num = np.array(
            [48, 64, 96, 128, 160, 192, 224, 256, 320, 384, 512, 640])
        self.repeat = np.array([0, 1, 2])
        self.k_size = np.array([3, 5])

    def init_tokens(self):
        if self.block_mask != None:
            return [0] * (len(self.block_mask) * 6)
        else:
            return [0] * (self.block_num * 6)

    def range_table(self):
        range_table_base = []
        if self.block_mask != None:
            range_table_length = len(self.block_mask)
        else:
            range_table_length = self.block_num

        for i in range(range_table_length):
            range_table_base.append(len(self.filter_num))
            range_table_base.append(len(self.filter_num))
            range_table_base.append(len(self.filter_num))
            range_table_base.append(len(self.k_size))
            range_table_base.append(len(self.repeat))
            range_table_base.append(len(self.repeat))

        return range_table_base

    def token2arch(self, tokens=None):
        if tokens == None:
            tokens = self.init_tokens()

        self.bottleneck_params_list = []
        if self.block_mask != None:
            for i in range(len(self.block_mask)):
                self.bottleneck_params_list.append(
                    (self.filter_num[tokens[i * 6]],
                     self.filter_num[tokens[i * 6 + 1]],
                     self.filter_num[tokens[i * 6 + 2]],
                     self.k_size[tokens[i * 6 + 3]],
                     self.repeat[tokens[i * 6 + 4]],
                     self.repeat[tokens[i * 6 + 5]], 2
                     if self.block_mask[i] == 1 else 1))
        else:
            repeat_num = int(self.block_num / self.downsample_num)
            num_minus = self.block_num % self.downsample_num
            for i in range(self.downsample_num):
                self.bottleneck_params_list.append(
                    (self.filter_num[tokens[i * 6]],
                     self.filter_num[tokens[i * 6 + 1]],
                     self.filter_num[tokens[i * 6 + 2]],
                     self.k_size[tokens[i * 6 + 3]],
                     self.repeat[tokens[i * 6 + 4]],
                     self.repeat[tokens[i * 6 + 5]], 2))
                for k in range(repeat_num - 1):
                    kk = k * self.downsample_num + i
                    self.bottleneck_params_list.append(
                        (self.filter_num[tokens[kk * 6]],
                         self.filter_num[tokens[kk * 6 + 1]],
                         self.filter_num[tokens[kk * 6 + 2]],
                         self.k_size[tokens[kk * 6 + 3]],
                         self.repeat[tokens[kk * 6 + 4]],
                         self.repeat[tokens[kk * 6 + 5]], 1))
                if self.downsample_num - i <= num_minus:
                    j = self.downsample_num * (repeat_num - 1) + i
                    self.bottleneck_params_list.append(
                        (self.filter_num[tokens[j * 6]],
                         self.filter_num[tokens[j * 6 + 1]],
                         self.filter_num[tokens[j * 6 + 2]],
                         self.k_size[tokens[j * 6 + 3]],
                         self.repeat[tokens[j * 6 + 4]],
                         self.repeat[tokens[j * 6 + 5]], 1))

            if self.downsample_num == 0 and self.block_num != 0:
                for i in range(len(self.block_num)):
                    self.bottleneck_params_list.append(
                        (self.filter_num[tokens[i * 6]],
                         self.filter_num[tokens[i * 6 + 1]],
                         self.filter_num[tokens[i * 6 + 2]],
                         self.k_size[tokens[i * 6 + 3]],
                         self.repeat[tokens[i * 6 + 4]],
                         self.repeat[tokens[i * 6 + 5]], 1))

        def net_arch(input, return_mid_layer=False, return_block=None):
            layer_count = 0
            mid_layer = dict()
            for i, layer_setting in enumerate(self.bottleneck_params_list):
                filter_num1, filter_num2, filter_num3, k_size, repeat1, repeat2, stride = layer_setting
                if stride == 2:
                    layer_count += 1
                if check_points((layer_count - 1), return_block):
                    mid_layer[layer_count - 1] = input

                input = self._bottleneck_block(
                    input=input,
                    num_filters1=filter_num1,
                    num_filters2=filter_num3,
                    num_filters3=filter_num3,
                    kernel_size=k_size,
                    repeat1=repeat1,
                    repeat2=repeat2,
                    stride=stride,
                    name='resnet' + str(i + 1))

            if return_mid_layer:
                return input, mid_layer
            else:
                return input,

        return net_arch

    def _shortcut(self, input, ch_out, stride, name=None):
        ch_in = input.shape[1]
        if ch_in != ch_out or stride != 1:
            return conv_bn_layer(
                input=input,
                filter_size=1,
                num_filters=ch_out,
                stride=stride,
                name=name + '_shortcut')
        else:
            return input

    def _bottleneck_block(self,
                          input,
                          num_filters1,
                          num_filters2,
                          num_filters3,
                          kernel_size,
                          repeat1,
                          repeat2,
                          stride,
                          name=None):
        short = self._shortcut(input, num_filters3, stride, name=name)

        for i in range(repeat1):
            input = conv_bn_layer(
                input=input,
                num_filters=num_filters1,
                filter_size=1,
                stride=1,
                act='relu',
                name=name + '_bottleneck_conv0_{}'.format(str(i)))

        input = conv_bn_layer(
            input=input,
            num_filters=num_filters2,
            filter_size=kernel_size,
            stride=stride,
            act='relu',
            name=name + '_bottleneck_conv1')
        for i in range(repeat2):
            input = conv_bn_layer(
                input=input,
                num_filters=num_filters3,
                filter_size=1,
                stride=1,
                act=None,
                name=name + '_bottleneck_conv2_{}'.format(str(i)))

        return fluid.layers.elementwise_add(
            x=short, y=input, act='relu', name=name + '_bottleneck_add')