.. _cn_api_fluid_layers_row_conv: row_conv ------------------------------- :api_attr: 声明式编程模式(静态图) .. py:function:: paddle.fluid.layers.row_conv(input, future_context_size, param_attr=None, act=None) 该接口为行卷积(Row-convolution operator)或称之为超前卷积(lookahead convolution),最早介绍于DeepSpeech2论文中,论文链接: ``_ 双向的RNN在深度语音模型中很有用,它通过对整个序列执行正向和反向传递来学习序列的表示。然而,与单向RNNs不同的是,在线部署和低延迟设置中,双向RNNs具有难度。超前卷积将来自未来子序列的信息以一种高效的方式进行计算,以改进单向递归神经网络。 row convolution operator 与一维序列卷积不同,计算方法如下: 给定输入序列长度为 :math:`t` 的输入序列 :math:`X` 和输入维度 :math:`D` ,以及一个大小为 :math:`context * D` 的滤波器 :math:`W` ,输出序列卷积为: .. math:: out_i = \sum_{j=i}^{i+context-1} X_{j} · W_{j-i} 公式中: - :math:`out_i` : 第i行输出变量形为[1, D]. - :math:`context` : 下文(future context)大小 - :math:`X_j` : 第j行输出变量,形为[1,D] - :math:`W_{j-i}` : 第(j-i)行参数,其形状为[1,D]。 详细请参考 `设计文档 `_ 。 参数: - **input** (Variable) -- 支持输入为LodTensor和Tensor,输入类型可以是[float32, float64],它支持可变时间长度的输入序列。当输入input为LodTensor时,其内部张量是一个具有形状(T x N)的矩阵,其中T是这个mini batch中的总的timestep,N是输入数据维数。当输入input为Tensor时,其形状为(B x T x N)的三维矩阵,B为mini batch大小,T为每个batch输入中的最大timestep,N是输入数据维数。当输入input为LoDTensor,形状为[9, N],LoD信息为[2, 3, 4],等价于输入input为形状是[3, 4, N]的Tensor。 - **future_context_size** (int) -- 下文大小。请注意,卷积核的shape是[future_context_size + 1, N],N和输入input的数据维度N保持一致。 - **param_attr** (ParamAttr) -- 参数的属性,包括名称、初始化器等。 - **act** (str) -- 非线性激活函数。 返回:表示row_conv计算结果的Variable,数据类型、维度和输入input相同。 **代码示例** .. code-block:: python import paddle.fluid as fluid # LoDTensor input x = fluid.layers.data(name='x', shape=[9, 16], dtype='float32', lod_level=3, append_batch_size=False) out = fluid.layers.row_conv(input=x, future_context_size=2) # Tensor input x = fluid.layers.data(name='x', shape=[9, 4, 16], dtype='float32', append_batch_size=False) out = fluid.layers.row_conv(input=x, future_context_size=2)