hierarchical-layer.rst 4.9 KB
Newer Older
D
dangqingqing 已提交
1 2 3
###########################
支持双层序列作为输入的Layer
###########################
Y
Yu Yang 已提交
4

D
dangqingqing 已提交
5 6 7 8
..	contents::

概述
====
Y
Yu Yang 已提交
9 10 11 12 13 14 15 16 17 18 19 20

在自然语言处理任务中,序列是一种常见的数据类型。一个独立的词语,可以看作是一个非序列输入,或者,我们称之为一个0层的序列;由词语构成的句子,是一个单层序列;若干个句子构成一个段落,是一个双层的序列。

双层序列是一个嵌套的序列,它的每一个元素,又是一个单层的序列。这是一种非常灵活的数据组织方式,帮助我们构造一些复杂的输入信息。

我们可以按照如下层次定义非序列,单层序列,以及双层序列。

+ 0层序列:一个独立的元素,类型可以是PaddlePaddle支持的任意输入数据类型
+ 单层序列:排成一列的多个元素,每个元素是一个0层序列,元素之间的顺序是重要的输入信息
+ 双层序列:排成一列的多个元素,每个元素是一个单层序列,称之为双层序列的一个子序列(subseq),subseq的每个元素是一个0层序列

在 PaddlePaddle中,下面这些Layer能够接受双层序列作为输入,完成相应的计算。
D
dangqingqing 已提交
21 22 23 24 25 26 27 28 29 30 31 32

pooling_layer
==============

pooling_layer 的使用示例如下,详细见 `pooling_layer`_ 配置API。

..	code-block:: bash

        seq_pool = pooling_layer(input=layer,
                                 pooling_type=AvgPooling(),
                                 agg_level=AggregateLevel.EACH_SEQUENCE)
        
Y
Yu Yang 已提交
33
- `pooling_type` 目前支持两种,分别是:MaxPooling()和AvgPooling()。
D
dangqingqing 已提交
34 35 36

- `agg_level=AggregateLevel.TIMESTEP` 时(默认值):

Y
Yu Yang 已提交
37 38 39
  - 作用:双层序列经过运算变成一个0层序列,或单层序列经过运算变成一个0层序列
  - 输入:一个双层序列,或一个单层序列
  - 输出:一个0层序列,即整个输入序列(单层或双层)的平均值(或最大值)
D
dangqingqing 已提交
40 41 42

- `agg_level=AggregateLevel.EACH_SEQUENCE` 时:

Y
Yu Yang 已提交
43 44 45 46
  - 作用:一个双层序列经过运算变成一个单层序列
  - 输入:必须是一个双层序列
  - 输出:一个单层序列,序列的每个元素是原来双层序列每个subseq元素的平均值(或最大值)

D
dangqingqing 已提交
47 48 49 50 51 52 53 54 55 56 57
last_seq 和 first_seq
=====================

last_seq 的使用示例如下( `first_seq`_ 类似),详细见 `last_seq`_ 配置API。

..	code-block:: bash

        last = last_seq(input=layer,
                        agg_level=AggregateLevel.EACH_SEQUENCE)
        
- `agg_level=AggregateLevel.TIMESTEP` 时(默认值):
Y
Yu Yang 已提交
58 59 60 61

  - 作用:一个双层序列经过运算变成一个0层序列,或一个单层序列经过运算变成一个0层序列
  - 输入:一个双层序列或一个单层序列
  - 输出:一个0层序列,即整个输入序列(双层或者单层)最后一个,或第一个元素。
D
dangqingqing 已提交
62 63

- `agg_level=AggregateLevel.EACH_SEQUENCE` 时:
Y
Yu Yang 已提交
64 65 66 67
  - 作用:一个双层序列经过运算变成一个单层序列
  - 输入:必须是一个双层序列
  - 输出:一个单层序列,其中每个元素是双层序列中每个subseq最后一个(或第一个)元素。

D
dangqingqing 已提交
68 69 70 71 72 73 74 75 76 77 78 79
expand_layer
============

expand_layer 的使用示例如下,详细见 `expand_layer`_ 配置API。

..	code-block:: bash

        expand = expand_layer(input=layer1,
                              expand_as=layer2,
                              expand_level=ExpandLevel.FROM_TIMESTEP)
        
- `expand_level=ExpandLevel.FROM_TIMESTEP` 时(默认值):
Y
Yu Yang 已提交
80 81

  - 作用:一个0层序列经过运算扩展成一个单层序列,或者一个双层序列
D
dangqingqing 已提交
82 83 84 85 86
  - 输入:layer1必须是一个0层序列,是待扩展的数据;layer2 可以是一个单层序列,或者是一个双层序列,提供扩展的长度信息
  - 输出:一个单层序列或一个双层序列,输出序列的类型(双层序列或单层序列)和序列中含有元素的数目同 layer2 一致。若输出是单层序列,单层序列的每个元素(0层序列),都是对layer1元素的拷贝;若输出是双层序列,双层序列每个subseq中每个元素(0层序列),都是对layer1元素的拷贝

- `expand_level=ExpandLevel.FROM_SEQUENCE` 时:

Y
Yu Yang 已提交
87
  - 作用:一个单层序列经过运算扩展成一个双层序列
D
dangqingqing 已提交
88 89 90 91 92 93 94 95
  - 输入:layer1必须是一个单层序列,是待扩展的数据;layer2 必须是一个双层序列,提供扩展的长度信息
  - 输出:一个双层序列,序列中含有元素的数目同 layer2 一致。要求单层序列含有元素的数目(0层序列)和双层序列含有subseq 的数目一致。单层序列第i个元素(0层序列),被扩展为一个单层序列,构成了输出双层序列的第i个 subseq 。


.. _pooling_layer: ../../../doc/ui/api/trainer_config_helpers/layers.html#pooling-layer
.. _last_seq: ../../../doc/ui/api/trainer_config_helpers/layers.html#last-seq
.. _first_seq: ../../../doc/ui/api/trainer_config_helpers/layers.html#first-seq
.. _expand_layer: ../../../doc/ui/api/trainer_config_helpers/layers.html#expand-layer