conv2d_cn.rst 5.6 KB
Newer Older
H
Hao Wang 已提交
1 2 3 4 5 6 7
.. _cn_api_fluid_layers_conv2d:

conv2d
-------------------------------

.. py:function:: paddle.fluid.layers.conv2d(input, num_filters, filter_size, stride=1, padding=0, dilation=1, groups=None, param_attr=None, bias_attr=None, use_cudnn=True, act=None, name=None)

L
lvmengsi 已提交
8
二维卷积层(convolution2D layer)根据输入、滤波器(filter)、步长(stride)、填充(padding)、膨胀比例(dilations)一组参数计算输出特征层大小。输入和输出是NCHW格式,其中N是批尺寸,C是通道数,H是特征层的高度,W是特征层的宽度。滤波器是MCHW格式,M是输出图像通道数,C是输入图像通道数,H是滤波器高度,W是滤波器宽度。如果组数大于1,C等于输入图像通道数除以组数的结果。详情请参考UFLDL's : `卷积 <http://ufldl.stanford.edu/tutorial/supervised/FeatureExtractionUsingConvolution/>`_ 。如果bias_attr不为False,卷积计算会添加偏置项。如果指定了激活函数类型,相应的激活函数会作用在最终结果上。
H
Hao Wang 已提交
9 10 11 12 13 14 15 16

对每个输入X,有等式:

.. math::

    Out = \sigma \left ( W * X + b \right )

其中:
L
lvmengsi 已提交
17 18
    - :math:`X` :输入图像,NCHW格式的张量(Tensor)
    - :math:`W` :滤波器,MCHW格式的张量(Tensor)
H
Hao Wang 已提交
19
    - :math:`*` : 卷积操作
L
lvmengsi 已提交
20
    - :math:`b` :偏置值,二维张量(Tensor),shape为 ``[M,1]``
H
Hao Wang 已提交
21
    - :math:`\sigma` :激活函数
L
lvmengsi 已提交
22
    - :math:`Out` :输出值, ``Out`` 和 ``X`` 的shape可能不同
H
Hao Wang 已提交
23 24 25 26 27

**示例**

- 输入:

L
lvmengsi 已提交
28
  输入shape::math:`(N,C_{in},H_{in},W_{in})`
H
Hao Wang 已提交
29

L
lvmengsi 已提交
30
  滤波器shape: :math:`(C_{out},C_{in},H_{f},W_{f})`
H
Hao Wang 已提交
31 32 33

- 输出:

L
lvmengsi 已提交
34
  输出shape: :math:`(N,C_{out},H_{out},W_{out})`
H
Hao Wang 已提交
35 36 37 38 39 40 41 42 43 44

其中

.. math::

    H_{out} = \frac{\left ( H_{in}+2*paddings[0]-\left ( dilations[0]*\left ( H_{f}-1 \right )+1 \right ) \right )}{strides[0]}+1

    W_{out} = \frac{\left ( W_{in}+2*paddings[1]-\left ( dilations[1]*\left ( W_{f}-1 \right )+1 \right ) \right )}{strides[1]}+1

参数:
L
lvmengsi 已提交
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
    - **input** (Variable) - 输入,格式为[N,C,H,W]的4-D Tensor。数据类型:float32和float64。
    - **num_filters** (int) - 滤波器(卷积核)的个数。和输出图像通道相同。
    - **filter_size** (int|tuple) - 滤波器大小。如果filter_size是一个元组,则必须包含两个整型数,(filter_size_height,filter_size_width)。否则,filter_size_height = filter_size_width = filter_size。
    - **stride** (int|tuple) - 步长stride大小。滤波器和输入进行卷积计算时滑动的步长。如果步长stride是一个元组,则必须包含两个整型数,(stride_height,stride_width)。否则,stride_height = stride_width = stride。默认:stride = 1。
    - **padding** (int|tuple) - 填充padding大小,输入的每个特征层四周填充的0的数量,padding_height代表特征层上下两边每一边填充0的数量,padding_width代表特征层左右两边每一边填充0的数量。如果填充padding为元组,则必须包含两个整型数,(padding_height,padding_width)。否则,padding_height = padding_width = padding。默认:padding = 0。
    - **dilation** (int|tuple) - 膨胀比例dilation大小。空洞卷积时会指该参数,滤波器对输入进行卷积时,感受野里每相邻两个特征点之间的空洞信息,根据`可视化效果图<https://github.com/vdumoulin/conv_arithmetic/blob/master/README.md>`_较好理解。如果膨胀比例dialation为元组,则必须包含两个整型数,(dilation_height,dilation_width)。否则,dilation_height = dilation_width = dilation。默认:dilation = 1。
    - **groups** (int) - 二维卷积层(conv2d layer)的组数。根据Alex Krizhevsky的深度卷积神经网络(CNN)论文中的成组卷积:当group=2,输入和滤波器分别根据通道数量平均分为两组,第一组滤波器和第一组输入进行卷积计算,第二组滤波器和第二组输入进行卷积计算。默认:groups = 1。
    - **param_attr** (ParamAttr|None) :指定权重参数属性的对象。默认值为None,表示使用默认的权重参数属性。具体用法请参见 :ref:`cn_api_fluid_ParamAttr` 。conv2d算子默认的权重初始化是Xavier。
    - **bias_attr** (ParamAttr|False|None)- 指定偏置参数属性的对象。默认值为None,表示使用默认的偏置参数属性。具体用法请参见 :ref:`cn_api_fluid_ParamAttr` 。conv2d算子默认的偏置初始化是0.0。
    - **use_cudnn** (bool) - 是否用cudnn核,仅当下载cudnn库才有效。默认:True。
    - **act** (str|None) - 激活函数类型,如果设为None,则未添加激活函数。默认:None。
    - **name** (str|None) – 具体用法请参见 :ref:`cn_api_guide_Name` ,一般无需设置,默认值为None。

返回:维度和输入相同的Tensor。如果未指定激活层,则返回卷积计算的结果,如果指定激活层,则返回卷积和激活计算之后的最终结果。

返回类型:Variable
H
Hao Wang 已提交
61 62 63 64 65 66

**代码示例**:

.. code-block:: python

    import paddle.fluid as fluid
L
lvmengsi 已提交
67
    import numpy as np
H
Hao Wang 已提交
68
    data = fluid.layers.data(name='data', shape=[3, 32, 32], dtype='float32')
L
lvmengsi 已提交
69 70 71 72 73 74 75 76
    param_attr = fluid.ParamAttr(name='conv2d.weight', initializer=fluid.initializer.Xavier(uniform=False), learning_rate=0.001)
    res = fluid.layers.conv2d(input=data, num_filters=2, filter_size=3, act="relu", param_attr=param_attr)
    place = fluid.CPUPlace()
    exe = fluid.Executor(place)
    exe.run(fluid.default_startup_program())
    x = np.random.rand(1, 3, 32, 32).astype("float32")
    output = exe.run(feed={"data": x}, fetch_list=[res])
    print(output)
H
Hao Wang 已提交
77 78