Merge branch 'develop' of https://github.com/PaddlePaddle/FluidDoc into pr/19

21ed9d77 · yuyang18 · db5cfcb6 · 2a036359 · 21ed9d77 · 21ed9d77
38 changed file
--- a/source/api_reference/average.rst
+++ b/source/api_reference/average.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_average:
 =============
 fluid.average
 =============

--- a/source/api_reference/backward.rst
+++ b/source/api_reference/backward.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_backward:
 ==============
 fluid.backward
 ==============

--- a/source/api_reference/clip.rst
+++ b/source/api_reference/clip.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_clip:
 ==========
 fluid.clip
 ==========
@@ -41,19 +43,3 @@ GradientClipByGlobalNorm
    :members:
    :noindex:
-.. _api_fluid_clip_append_gradient_clip_ops:
-append_gradient_clip_ops
------------------------
-..  autofunction:: paddle.fluid.clip.append_gradient_clip_ops
-    :noindex:
-.. _api_fluid_clip_error_clip_callback:
-error_clip_callback
-------------------
-..  autofunction:: paddle.fluid.clip.error_clip_callback
-    :noindex:
--- a/source/api_reference/data_feeder.rst
+++ b/source/api_reference/data_feeder.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_data_feeder:
 =================
 fluid.data_feeder
 =================

--- a/source/api_reference/executor.rst
+++ b/source/api_reference/executor.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_executor:
 ==============
 fluid.executor
 ==============
@@ -30,12 +32,12 @@ scope_guard
 ..  autofunction:: paddle.fluid.executor.scope_guard
    :noindex:
-.. _api_fluid_executor_switch_scope:
+.. _api_fluid_executor__switch_scope:
-switch_scope
+_switch_scope
------------
+-------------
-..  autofunction:: paddle.fluid.executor.switch_scope
+..  autofunction:: paddle.fluid.executor._switch_scope
    :noindex:
 .. _api_fluid_executor_fetch_var:

--- a/source/api_reference/fluid.rst
+++ b/source/api_reference/fluid.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid:
 =====
 fluid
 =====
@@ -65,22 +67,6 @@ program_guard
 ..  autofunction:: paddle.fluid.program_guard
    :noindex:
-.. _api_fluid_switch_startup_program:
-switch_startup_program
----------------------
-..  autofunction:: paddle.fluid.switch_startup_program
-    :noindex:
-.. _api_fluid_switch_main_program:
-switch_main_program
-------------------
-..  autofunction:: paddle.fluid.switch_main_program
-    :noindex:
 .. _api_fluid_get_var:
 get_var
@@ -114,12 +100,12 @@ scope_guard
 ..  autofunction:: paddle.fluid.scope_guard
    :noindex:
-.. _api_fluid_switch_scope:
+.. _api_fluid__switch_scope:
-switch_scope
+_switch_scope
------------
+-------------
-..  autofunction:: paddle.fluid.switch_scope
+..  autofunction:: paddle.fluid._switch_scope
    :noindex:
 .. _api_fluid_fetch_var:
@@ -243,6 +229,15 @@ Inferencer
    :members:
    :noindex:
+.. _api_fluid_DistributeTranspiler:
+DistributeTranspiler
+--------------------
+..  autoclass:: paddle.fluid.DistributeTranspiler
+    :members:
+    :noindex:
 .. _api_fluid_memory_optimize:
 memory_optimize
@@ -374,3 +369,12 @@ DataFeeder
    :members:
    :noindex:
+.. _api_fluid_Scope:
+Scope
+-----
+..  autoclass:: paddle.fluid.Scope
+    :members:
+    :noindex:
--- a/source/api_reference/gen_doc.py
+++ b/source/api_reference/gen_doc.py
@@ -48,7 +48,7 @@ class DocGenerator(object):
    !DO NOT EDIT THIS FILE MANUALLY!
 ''')
+        self._print_ref_raw_("_".join(self.module_name.split(".")))
        self._print_header_(self.module_name, dot='=', is_title=True)
    def print_submodule(self, submodule_name):
@@ -107,9 +107,10 @@ class DocGenerator(object):
        self.stream.write('\n')
    def _print_ref_(self, name):
-        self.stream.write(".. _api_{0}_{1}:\n\n".format(
+        self._print_ref_raw_("_".join(self.module_name.split(".") + [name]))
-          "_".join(self.module_name.split(".")), name
-        ))
+    def _print_ref_raw_(self, anchor):
+        self.stream.write(".. _api_{0}:\n\n".format(anchor))
 def main():

--- a/source/api_reference/initializer.rst
+++ b/source/api_reference/initializer.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_initializer:
 =================
 fluid.initializer
 =================
@@ -50,6 +52,15 @@ Bilinear
    :members:
    :noindex:
+.. _api_fluid_initializer_MSRA:
+MSRA
+----
+..  autoclass:: paddle.fluid.initializer.MSRA
+    :members:
+    :noindex:
 .. _api_fluid_initializer_force_init_on_cpu:
 force_init_on_cpu
@@ -111,3 +122,12 @@ BilinearInitializer
    :members:
    :noindex:
+.. _api_fluid_initializer_MSRAInitializer:
+MSRAInitializer
+---------------
+..  autoclass:: paddle.fluid.initializer.MSRAInitializer
+    :members:
+    :noindex:
--- a/source/api_reference/io.rst
+++ b/source/api_reference/io.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_io:
 ========
 fluid.io
 ========

--- a/source/api_reference/layers.rst
+++ b/source/api_reference/layers.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_layers:
 ============
 fluid.layers
 ============
@@ -910,6 +912,14 @@ log
 ..  autofunction:: paddle.fluid.layers.log
    :noindex:
+.. _api_fluid_layers_crop:
+crop
+----
+..  autofunction:: paddle.fluid.layers.crop
+    :noindex:
 ops
 ===

--- a/source/api_reference/metrics.rst
+++ b/source/api_reference/metrics.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_metrics:
 =============
 fluid.metrics
 =============
@@ -23,6 +25,24 @@ CompositeMetric
    :members:
    :noindex:
+.. _api_fluid_metrics_Precision:
+Precision
+---------
+..  autoclass:: paddle.fluid.metrics.Precision
+    :members:
+    :noindex:
+.. _api_fluid_metrics_Recall:
+Recall
+------
+..  autoclass:: paddle.fluid.metrics.Recall
+    :members:
+    :noindex:
 .. _api_fluid_metrics_Accuracy:
 Accuracy

--- a/source/api_reference/nets.rst
+++ b/source/api_reference/nets.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_nets:
 ==========
 fluid.nets
 ==========

--- a/source/api_reference/optimizer.rst
+++ b/source/api_reference/optimizer.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_optimizer:
 ===============
 fluid.optimizer
 ===============
@@ -59,6 +61,15 @@ DecayedAdagrad
    :members:
    :noindex:
+.. _api_fluid_optimizer_Ftrl:
+Ftrl
+----
+..  autoclass:: paddle.fluid.optimizer.Ftrl
+    :members:
+    :noindex:
 .. _api_fluid_optimizer_SGDOptimizer:
 SGDOptimizer
@@ -122,6 +133,15 @@ RMSPropOptimizer
    :members:
    :noindex:
+.. _api_fluid_optimizer_FtrlOptimizer:
+FtrlOptimizer
+-------------
+..  autoclass:: paddle.fluid.optimizer.FtrlOptimizer
+    :members:
+    :noindex:
 .. _api_fluid_optimizer_Adadelta:
 Adadelta
@@ -149,3 +169,12 @@ Optimizer
    :members:
    :noindex:
+.. _api_fluid_optimizer_RMSPropOptimizer:
+RMSPropOptimizer
+----------------
+..  autoclass:: paddle.fluid.optimizer.RMSPropOptimizer
+    :members:
+    :noindex:
--- a/source/api_reference/param_attr.rst
+++ b/source/api_reference/param_attr.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_param_attr:
 ================
 fluid.param_attr
 ================

--- a/source/api_reference/profiler.rst
+++ b/source/api_reference/profiler.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_profiler:
 ==============
 fluid.profiler
 ==============

--- a/source/api_reference/recordio_writer.rst
+++ b/source/api_reference/recordio_writer.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_recordio_writer:
 =====================
 fluid.recordio_writer
 =====================

--- a/source/api_reference/regularizer.rst
+++ b/source/api_reference/regularizer.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_regularizer:
 =================
 fluid.regularizer
 =================
@@ -13,15 +15,6 @@ append_regularization_ops
 ..  autofunction:: paddle.fluid.regularizer.append_regularization_ops
    :noindex:
-.. _api_fluid_regularizer_WeightDecayRegularizer:
-WeightDecayRegularizer
----------------------
-..  autoclass:: paddle.fluid.regularizer.WeightDecayRegularizer
-    :members:
-    :noindex:
 .. _api_fluid_regularizer_L1Decay:
 L1Decay

--- a/source/api_reference/transpiler.rst
+++ b/source/api_reference/transpiler.rst
 ..  THIS FILE IS GENERATED BY `gen_doc.{py|sh}`
    !DO NOT EDIT THIS FILE MANUALLY!
+.. _api_fluid_transpiler:
 ================
 fluid.transpiler
 ================
+.. _api_fluid_transpiler_DistributeTranspiler:
+DistributeTranspiler
+--------------------
+..  autoclass:: paddle.fluid.transpiler.DistributeTranspiler
+    :members:
+    :noindex:
 .. _api_fluid_transpiler_memory_optimize:
 memory_optimize

--- a/source/beginners_guide/index.rst
+++ b/source/beginners_guide/index.rst
@@ -7,6 +7,6 @@
 ..  toctree::
    :maxdepth: 2
-    install/index.rst
+    install/install_doc.rst
    quick_start/quick_start.rst
    basics/theoretical_background.rst
--- a/source/beginners_guide/install/build_from_source_cn.rst
+++ b/source/beginners_guide/install/build_from_source_cn.rst
-../../../paddle/doc/fluid/build_and_install/build_from_source_cn.rst
\ No newline at end of file
--- a/source/beginners_guide/install/details/foo.rst
+++ b/source/beginners_guide/install/details/foo.rst
-###
-FAQ
-###
--- a/source/beginners_guide/install/docker_install_cn.rst
+++ b/source/beginners_guide/install/docker_install_cn.rst
-../../../paddle/doc/fluid/build_and_install/docker_install_cn.rst
\ No newline at end of file
--- a/source/beginners_guide/install/index.rst
+++ b/source/beginners_guide/install/index.rst
-.. _quick_start_install:
-安装与编译
-==========
-.. _install_steps:
-PaddlePaddle针对不同的用户群体提供了多种安装方式。
-专注深度学习模型开发
--------------------
-PaddlePaddle提供了多种python wheel包，可通过pip一键安装：
-.. toctree::
-	:maxdepth: 1
-	pip_install_cn.rst
-这是最便捷的安装方式，请根据机器配置和系统选择对应的安装包。
-关注底层框架
-------------
-PaddlePaddle提供了基于Docker的安装方式，请参照以下教程：
-.. toctree::
-	:maxdepth: 1
-	docker_install_cn.rst
-我们推荐在Docker中运行PaddlePaddle，该方式具有以下优势：
- 无需单独安装第三方依赖
- 方便分享运行时环境，易于问题的复现
-对于有定制化二进制文件需求的用户，我们同样提供了从源码编译安装PaddlePaddle的方法：
-.. toctree::
-    :maxdepth: 1
-    build_from_source_cn.rst
-.. warning::
-	需要提醒的是，这种安装方式会涉及到一些第三方库的下载、编译及安装，整个安装过程耗时较长。
-常见问题汇总
--------------
-如果在安装过程中遇到了问题，请先尝试在下面的页面寻找答案：
-:ref:`常见问题解答 <install_faq>`
-如果问题没有得到解决，欢迎向PaddlePaddle社区反馈问题：
-`创建issue <https://github.com/PaddlePaddle/Paddle/issues/new>`_
--- a/source/beginners_guide/install/install_doc.rst
+++ b/source/beginners_guide/install/install_doc.rst
--- a/source/beginners_guide/install/others/foo.rst
+++ b/source/beginners_guide/install/others/foo.rst
-###
-FAQ
-###
--- a/source/beginners_guide/install/paddleci.png
+++ b/source/beginners_guide/install/paddleci.png
--- a/source/beginners_guide/install/pip_install_cn.rst
+++ b/source/beginners_guide/install/pip_install_cn.rst
-../../../paddle/doc/fluid/build_and_install/pip_install_cn.rst
\ No newline at end of file
--- a/source/beginners_guide/quick_start/quick_start.rst
+++ b/source/beginners_guide/quick_start/quick_start.rst
@@ -14,4 +14,4 @@ PaddlePaddle Fluid 是PaddlePaddle的新版本。他使用类似于编程语言
    :maxdepth: 2
    fit_a_line/index.md
    recognize_digits/index.md
\ No newline at end of file
--- a/source/user_guides/howto/configure_simple_model/index.rst
+++ b/source/user_guides/howto/configure_simple_model/index.rst
+..  _user_guide_configure_simple_model:
+##############
+配置简单的网络
+##############
+在解决实际问题时，可以先从逻辑层面对问题进行建模，明确模型所需要的 **输入数据类型**、**计算逻辑**、**求解目标** 以及 **优化算法**。PaddlePaddle提供了丰富的算子来实现模型逻辑。下面以一个简单回归任务举例说明如何使用PaddlePaddle构建模型。该例子完整代码参见 `fit_a_line <https://github.com/PaddlePaddle/Paddle/blob/develop/python/paddle/fluid/tests/book/test_fit_a_line.py>`_。
+问题描述及定义
+##############
+问题描述: 给定一组数据 :math:`<X, Y>`，求解出函数 :math:`f`，使得 :math:`y=f(x)`，其中 :math:`x\subset X` 表示一条样本的特征，为 :math:`13` 维的实数向量；:math:`y \subset Y` 为一实数表示该样本对应的值。
+我们可以尝试用回归模型来对问题建模，回归问题的损失函数有很多，这里选择常用的均方误差。为简化问题，这里假定 :math:`f` 为简单的线性变换函数，同时选用随机梯度下降算法来求解模型。
+----------------+----------------------------------------------+
+| 输入数据类型   |  样本特征: 13 维 实数                        |
+                +----------------------------------------------+
+|                |  样本标签: 1 维 实数                         |
+----------------+----------------------------------------------+
+| 计算逻辑       | 使用线性模型，产生 1维实数作为模型的预测输出 |
+----------------+----------------------------------------------+
+| 求解目标       | 最小化模型预测输出与样本标签间的均方误差     |
+----------------+----------------------------------------------+
+| 优化算法       | 随机梯度下降                                 |
+----------------+----------------------------------------------+
+使用PaddlePadle建模
+###################
+从逻辑层面明确了输入数据格式、模型结构、损失函数以及优化算法后，需要使用PaddlePaddle提供的API及算子来实现模型逻辑。一个典型的模型主要包含4个部分，分别是：输入数据格式定义，模型前向计算逻辑，损失函数以及优化算法。
+数据层
+------
+PaddlePaddle提供了 :ref:`api_fluid_layers_data` 算子来描述输入数据的格式。
+:ref:`api_fluid_layers_data` 算子的输出是一个Variable。这个Variable的实际类型是Tensor。Tensor具有强大的表征能力，可以表示多维数据。为了精确描述数据结构，通常需要指定数据shape以及数值类型type。其中shape为一个整数向量，type可以是一个字符串类型。目前支持的数据类型参考    :ref:`user_guide_paddle_support_data_types` 。 模型训练一般会使用batch的方式读取数据，而batch的size在训练过程中可能不固定。data算子会依据实际数据来推断batch size，所以这里提供shape时不用关心batch size，只需关心一条样本的shape即可，更高级用法请参考 :ref:`user_guide_customize_batch_size_rank`。从上知，:math:`x` 为 :math:`13` 维的实数向量，:math:`y` 为实数，可使用下面代码定义数据层：
+.. code-block:: python
+    x = fluid.layers.data(name='x', shape=[13], dtype='float32')
+    y = fluid.layers.data(name='y', shape=[1], dtype='float32')
+该模型使用的数据比较简单，事实上data算子还可以描述变长的、嵌套的序列数据。也可以使用 :code:`open_files` 打开文件进行训练。更详细的文档可参照 :ref:`user_guide_prepare_data`。
+前向计算逻辑
+------------
+实现一个模型最重要的部分是实现计算逻辑，PaddlePaddle提供了丰富的算子。这些算子的封装粒度不同，通常对应一种或一组变换逻辑。算子输出即为对输入数据执行变换后的结果。用户可以灵活使用算子来完成复杂的模型逻辑。比如图像相关任务中会使用较多的卷积算子、序列任务中会使用LSTM/GRU等算子。复杂模型通常会组合多种算子，以完成复杂的变换。PaddlePaddle提供了非常自然的方式来组合算子，一般地可以使用下面的方式：
+.. code-block:: python
+    op_1_out = fluid.layers.op_1(input=op_1_in, ...)
+    op_2_out = fluid.layers.op_2(input=op_1_out, ...)
+    ...
+其中op_1和op_2表示算子类型，可以是fc来执行线性变换(全连接)，也可以是conv来执行卷积变换等。通过算子的输入输出的连接来定义算子的计算顺序以及数据流方向。上面的例子中，op_1的输出是op_2的输入，那么在执行计算时，会先计算op_1，然后计算op_2。更复杂的模型可能需要使用控制流算子，依据输入数据来动态执行，针对这种情况，PaddlePaddle提供了IfElseOp和WhileOp等。算子的文档可参考 :ref:`api_fluid_layers`。具体到这个任务, 我们使用一个fc算子：
+.. code-block:: python
+    y_predict = fluid.layers.fc(input=x, size=1, act=None)
+损失函数
+--------
+损失函数对应求解目标，我们可以通过最小化损失来求解模型。大多数模型使用的损失函数，输出是一个实数值。但是PaddlePaddle提供的损失算子一般是针对一条样本计算。当输入一个batch的数据时，损失算子的输出有多个值，每个值对应一条样本的损失，所以通常会在损失算子后面使用mean等算子，来对损失做归约。模型在一次前向迭代后会得到一个损失值，PaddlePaddle会自动执行链式求导法则计算模型里面每个参数和变量对应的梯度值。这里使用均方误差损失：
+.. code-block:: python
+    cost = fluid.layers.square_error_cost(input=y_predict, label=y)
+    avg_cost = fluid.layers.mean(cost)
+优化方法
+--------
+确定损失函数后，可以通过前向计算得到损失值，然后通过链式求导法则得到参数的梯度值。获取梯度值后需要更新参数，最简单的算法是随机梯度下降法：:math:`w=w - \eta \cdot g`。但是普通的随机梯度下降算法存在一些问题: 比如收敛不稳定等。为了改善模型的训练速度以及效果，学术界先后提出了很多优化算法，包括： :code:`Momentum`、:code:`RMSProp`、:code:`Adam` 等。这些优化算法采用不同的策略来更新模型参数，一般可以针对具体任务和具体模型来选择优化算法。不管使用何种优化算法，学习率一般是一个需要指定的比较重要的超参数，需要通过实验仔细调整。这里采用随机梯度下降算法：
+.. code-block:: python
+    sgd_optimizer = fluid.optimizer.SGD(learning_rate=0.001)
+更多优化算子可以参考 :ref:`api_fluid_optimizer` 。
+下一步做什么？
+##############
+使用PaddlePaddle实现模型时需要关注 **数据层**、**前向计算逻辑**、**损失函数** 和 **优化方法**。不同的任务需要的数据格式不同，涉及的计算逻辑不同，损失函数不同，优化方法也不同。PaddlePaddle提供了丰富的模型示例，可以以这些示例为参考来构建自己的模型结构。用户可以访问 `模型库 <https://github.com/PaddlePaddle/models/tree/develop/fluid>`_ 查看官方提供的示例。
--- a/source/user_guides/howto/index.rst
+++ b/source/user_guides/howto/index.rst
@@ -2,8 +2,11 @@
 如何使用PaddlePaddle
 ####################
 .. toctree::
-   :maxdepth: 2
+   :maxdepth: 2 
+   prepare_data/index
+   configure_simple_model/index
+   training/index
-   prepare_data/index
\ No newline at end of file
--- a/source/user_guides/howto/prepare_data/feeding_data.rst
+++ b/source/user_guides/howto/prepare_data/feeding_data.rst
@@ -36,7 +36,10 @@ PaddlePaddle Fluid支持使用 :ref:`api_fluid_layers_data` 配置数据层；
   维度的位置的话，请设置 :code:`fluid.layers.data(append_batch_size=False)` 。
   请参考进阶使用中的 :ref:`user_guide_customize_batch_size_rank` 。
-2. Fluid中用来做类别标签的数据类型是 :code:`int64`，并且标签从0开始。
+2. Fluid中用来做类别标签的数据类型是 :code:`int64`，并且标签从0开始。可用数据类型请参考 :ref:`user_guide_paddle_support_data_types`。
+.. _user_guide_feed_data_to_executor:
 传递训练数据给执行器
 ####################
@@ -145,4 +148,22 @@ PaddlePaddle Fluid默认batch size是数据的第一维度，以 :code:`-1` 表
                                  dtype="int64")
  这里 :code:`sentence` 的中间维度是batch size。这种数据排布会用在定长的循环神经
  网络中。
\ No newline at end of file
+.. _user_guide_paddle_support_data_types:
+Fluid目前支持的数据类型
+-----------------------
+PaddlePaddle Fluid目前支持的数据类型包括:
+   * float16： 部分操作支持
+   * float32:  主要实数类型
+   * float64:  次要实数类型，支持大部分操作
+   * int32:  次要标签类型
+   * int64: 主要标签类型
+   * uint64: 次要标签类型
+   * bool: 控制流数据类型
+   * int16: 次要标签类型
+   * uint8: 输入数据类型，可用于图像像素
\ No newline at end of file
--- a/source/user_guides/howto/training/cluster_quick_start.rst
+++ b/source/user_guides/howto/training/cluster_quick_start.rst
+..  _cluster_quick_start:
+分布式训练快速开始
+==================
+准备工作
+--------
+在本篇文章中，我们将会在介绍如何快速在一个集群中启动一个 PaddlePaddle
+的分布式训练任务，在开始之前，请按如下步骤做些准备工作：
+1. 准备一个至少4个节点的集群，并且保证网络可以联通，在本文中我们使用
+   ``*.paddlepaddle.com`` 来表示每个节点的主机名称，您可以根据集群的实际情况来修改它。
+2. 在开始之前确保已经阅读过 :ref:`how_to_install`
+   并且可以在集群的所有节点上可以正常运行 PaddlePaddle。
+启动集群训练任务
+----------------
+在启动集群训练脚本时，需要在不同的节点上指定不同的环境变量，具体如下：
+-----------------+-----------------+-----------------+---------------------+
+| 环境变量        | 数据类型        | 样例            | 描述                |
+=================+=================+=================+=====================+
+| PADDLE_TRAINING | str             | PSERVER,TRAINER | 训练节点的角色      |
+| _ROLE           |                 |                 |                     |
+-----------------+-----------------+-----------------+---------------------+
+| PADDLE_PSERVER_ | str             | ps0.paddlepaddl | 所有 pserver        |
+| IPS             |                 | e.com,ps1.paddl | 节点的 IP           |
+|                 |                 | epaddle.com…    | 地址或              |
+|                 |                 |                 | hostname,           |
+|                 |                 |                 | 用“,”分隔           |
+-----------------+-----------------+-----------------+---------------------+
+| PADDLE_PSERVER_ | int             | 6174            | pserver             |
+| PORT            |                 |                 | 节点监听的端口      |
+-----------------+-----------------+-----------------+---------------------+
+| PADDLE_TRAINERS | int             | 2               | 训练任务中          |
+|                 |                 |                 | trainer             |
+|                 |                 |                 | 节点的数量          |
+-----------------+-----------------+-----------------+---------------------+
+| PADDLE_CURRENT_ | str             | ps0.paddlepaddl | 当前 pserver        |
+| IP              |                 | e.com           | 节点的 IP           |
+|                 |                 |                 | 地址或 hostanme     |
+-----------------+-----------------+-----------------+---------------------+
+| PADDLE_TRAINER_ | int             | 0               | 当前 trainer        |
+| ID              |                 |                 | 节点的唯一 ID,      |
+|                 |                 |                 | 取值范围为从0开始到 |
+|                 |                 |                 | PADDLE_TRAINERS-1   |
+-----------------+-----------------+-----------------+---------------------+
+样例代码
+~~~~~~~~
+将下面程序代码保存为 ``fluid_dist.py``
+.. code:: python
+   import paddle
+   import paddle.fluid as fluid
+   import contextlib
+   import numpy
+   import unittest
+   # train reader
+   BATCH_SIZE = 20
+   train_reader = paddle.batch(
+       paddle.reader.shuffle(
+           paddle.dataset.uci_housing.train(), buf_size=500),
+       batch_size=BATCH_SIZE)
+   test_reader = paddle.batch(
+       paddle.reader.shuffle(
+           paddle.dataset.uci_housing.test(), buf_size=500),
+       batch_size=BATCH_SIZE)
+   def train_program():
+       y = fluid.layers.data(name='y', shape=[1], dtype='float32')
+       x = fluid.layers.data(name='x', shape=[13], dtype='float32')
+       y_predict = fluid.layers.fc(input=x, size=1, act=None)
+       loss = fluid.layers.square_error_cost(input=y_predict, label=y)
+       avg_loss = fluid.layers.mean(loss)
+       return avg_loss
+   def optimizer_func():
+       return fluid.optimizer.SGD(learning_rate=0.001)
+   def train(use_cuda, train_program):
+       place = fluid.CUDAPlace(0) if use_cuda else fluid.CPUPlace()
+       trainer = fluid.Trainer(
+           train_func=train_program, place=place, optimizer_func=optimizer_func)
+       def event_handler(event):
+           if isinstance(event, fluid.EndStepEvent):
+               if event.step == 10:
+                   test_metrics = trainer.test(
+                       reader=test_reader, feed_order=['x', 'y'])
+                   print("step {0}, loss: {1}".format(event.step, test_metrics))
+                   trainer.stop()
+       trainer.train(
+           reader=train_reader,
+           num_epochs=100,
+           event_handler=event_handler,
+           feed_order=['x', 'y'])
+   train(False, train_program)
+启动trainer节点和pserver节点
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+.. list-table::
+   :header-rows: 1
+   * - 启动节点
+     - 启动命令
+     - 说明
+   * - ps0.paddlepaddle.com
+     - :code:`PADDLE_TRAINING_ROLE=PSERVER PADDLE_CURRENT_IP=ps0.paddlepaddle.com PADDLE_PSERVER_IPS=ps0.paddlepaddle.com,ps1.paddlepaddle.com PADDLE_TRAINERS=2 PADDLE_PSERVER_PORT=6174 python fluid_dist.py`
+     - 启动 pserver 节点
+   * - ps1.paddlepaddle.com
+     - :code:`PADDLE_TRAINING_ROLE=PSERVER PADDLE_CURRENT_IP=ps1.paddlepaddle.com PADDLE_PSERVER_IPS=ps0.paddlepaddle.com,ps1.paddlepaddle.com PADDLE_TRAINERS=2 PADDLE_PSERVER_PORT=6174 python fluid_dist.py`
+     - 启动 pserver 节点
+   * - trainer0.paddlepaddle.com
+     - :code:`PADDLE_TRAINING_ROLE=TRAINER PADDLE_PSERVER_IPS=ps0.paddlepaddle.com,ps1.paddlepaddle.com PADDLE_TRAINERS=2 PADDLE_TRAINER_ID=0 PADDLE_PSERVER_PORT=6174 python fluid_dist.py`
+     - 启动第0号 trainer 节点
+   * - trainer1.paddlepaddle.com
+     - :code:`PADDLE_TRAINING_ROLE=TRAINER PADDLE_PSERVER_IPS=ps0.paddlepaddle.com,ps1.paddlepaddle.com PADDLE_TRAINERS=2 PADDLE_TRAINER_ID=1 PADDLE_PSERVER_PORT=6174 python fluid_dist.py`
+     - 启动第1号 trainer 节点
+**注意**
+-  需要先启动pserver节点再启动trainer节点
+-  看到trainer节点输出如下日志表示训练任务执行正确
+   .. code:: bash
+      step 10, loss: [258.2326202392578]
--- a/source/user_guides/howto/training/foo.rst
+++ b/source/user_guides/howto/training/foo.rst
-###
-FAQ
-###
--- a/source/user_guides/howto/training/index.rst
+++ b/source/user_guides/howto/training/index.rst
+############
+训练神经网络
+############
+PaddlePaddle Fluid支持单机训练，和多节点训练。每种训练模式下，都支持多种训练方法。
+.. toctree::
+   :maxdepth: 2
+   single_node
+   multi_node
--- a/source/user_guides/howto/training/multi_node.rst
+++ b/source/user_guides/howto/training/multi_node.rst
+########
+多机训练
+########
+.. toctree::
+   :maxdepth: 2
+   cluster_quick_start.md
\ No newline at end of file
--- a/source/user_guides/howto/training/save_load_variables.rst
+++ b/source/user_guides/howto/training/save_load_variables.rst
+.. _user_guide_save_load_vars:
+##################
+保存与载入模型变量
+##################
+模型变量分类
+############
+在PaddlePaddle Fluid中，所有的模型变量都用 :ref:`api_fluid_Variable` 作为基类进行表示。
+在该基类之下，模型变量主要可以分为以下几种类别：
+1. 模型参数
+  模型参数是深度学习模型中被训练和学习的变量，在训练过程中，训练框架根据反向传播算法计算出每一个模型参数当前的梯度，
+  并用优化器根据梯度对参数进行更新。模型的训练过程本质上可以看做是模型参数不断迭代更新的过程。
+  在PaddlePaddle Fluid中，模型参数用 :code:`fluid.framework.Parameter` 来表示，
+  这是一个 :ref:`api_fluid_Variable` 的派生类，除了 :ref:`api_fluid_Variable` 具有的各项性质以外，
+  :code:`fluid.framework.Parameter` 还可以配置自身的初始化方法、更新率等属性。
+2. 长期变量
+  长期变量指的是在整个训练过程中持续存在、不会因为一个迭代的结束而被销毁的变量，例如动态调节的全局学习率等。
+  在PaddlePaddle Fluid中，长期变量通过将 :ref:`api_fluid_Variable` 的 :code:`persistable`
+  属性设置为 :code:`True` 来表示。所有的模型参数都是长期变量，但并非所有的长期变量都是模型参数。
+3. 临时变量
+  不属于上面两个类别的所有模型变量都是临时变量，这种类型的变量只在一个训练迭代中存在，在每一个迭代结束后，
+  所有的临时变量都会被销毁，然后在下一个迭代开始之前，又会先构造出新的临时变量供本轮迭代使用。
+  一般情况下模型中的大部分变量都属于这一类别，例如输入的训练数据、一个普通的layer的输出等等。
+如何保存模型变量
+################
+根据用途的不同，我们需要保存的模型变量也是不同的。例如，如果我们只是想保存模型用来进行以后的预测，
+那么只保存模型参数就够用了。但如果我们需要保存一个checkpoint以备将来恢复训练，
+那么我们应该将各种长期变量都保存下来，甚至还需要记录一下当前的epoch和step的id。
+因为一些模型变量虽然不是参数，但对于模型的训练依然必不可少。
+因此，根据需求的不同，我们提供了两套API来分别进行模型的参数和checkpoint的保存。
+保存模型用于对新样本的预测
+==========================
+如果我们保存模型的目的是用于对新样本的预测，那么只保存模型参数就足够了。我们可以使用
+:ref:`api_fluid_io_save_params` 接口来进行模型参数的保存。
+例如：
+.. code-block:: python
+    import paddle.fluid as fluid
+    exe = fluid.Executor(fluid.CPUPlace())
+    param_path = "./my_paddle_model"
+    prog = fluid.default_main_program()
+    fluid.io.save_params(executor=exe, dirname=param_path, main_program=None)
+上面的例子中，通过调用 :code:`fluid.io.save_params` 函数，PaddlePaddle Fluid会对默认
+:ref:`api_fluid_Program` 也就是 :code:`prog` 中的所有模型变量进行扫描，
+筛选出其中所有的模型参数，并将这些模型参数保存到指定的 :code:`param_path` 之中。
+保存checkpoint用于将来恢复训练
+==============================
+在训练过程中，我们可能希望在一些节点上将当前的训练状态保存下来，
+以便在将来需要的时候恢复训练环境继续进行训练。这一般被称作“checkpoint”。
+想要保存checkpoint，可以使用 :ref:`api_fluid_io_save_checkpoint` 接口。
+例如：
+.. code-block:: python
+    import paddle.fluid as fluid
+    exe = fluid.Executor(fluid.CPUPlace())
+    path = "./checkpoints"
+    prog = fluid.default_main_program()
+    trainer_args = {"epoch_id": 200,
+                    "step_id": 20} # just an example
+    fluid.io.save_checkpoint(executor=exe,
+                                checkpoint_dir=path,
+                                trainer_id=0,
+                                trainer_args=trainer_args,
+                                main_program=prog,
+                                max_num_checkpoints=3)
+上面的例子中，通过调用 :code:`fluid.io.save_checkpoint` 函数，PaddlePaddle Fluid会对默认
+:ref:`api_fluid_Program` 也就是 :code:`prog` 中的所有模型变量进行扫描，
+根据一系列内置的规则自动筛选出其中所有需要保存的变量，并将他们保存到指定的 :code:`path` 目录下。
+:code:`fluid.io.save_checkpoint` 的各个参数中， :code:`trainer_id` 在单机情况下设置为0即可； :code:`trainer_args`
+为一个Python dict，用于给定当前的epoch_id和step_id；
+:code:`max_num_checkpoints` 用于表示的最大checkpoint数量，
+如果目录中已经存在的checkpoint数量超过这个值，那最早的checkpoint将被删除。
+如何载入模型变量
+################
+与模型变量的保存相对应，我们提供了两套API来分别载入模型的参数和载入模型的checkpoint。
+载入模型用于对新样本的预测
+==========================
+对于通过 :code:`fluid.io.save_params` 保存的模型，可以使用 :code:`fluid.io.load_params`
+来进行载入。
+例如：
+.. code-block:: python
+    import paddle.fluid as fluid
+    exe = fluid.Executor(fluid.CPUPlace())
+    param_path = "./my_paddle_model"
+    prog = fluid.default_main_program()
+    fluid.io.load_params(executor=exe, dirname=param_path,
+                         main_program=prog)
+上面的例子中，通过调用 :code:`fluid.io.load_params` 函数，PaddlePaddle Fluid会对
+:code:`prog` 中的所有模型变量进行扫描，筛选出其中所有的模型参数，
+并尝试从 :code:`param_path` 之中读取加载它们。
+需要格外注意的是，这里的 :code:`prog` 必须和调用 :code:`fluid.io.save_params`
+时所用的 :code:`prog` 中的前向部分完全一致，且不能包含任何参数更新的操作。如果两者存在不一致，
+那么可能会导致一些变量未被正确加载；如果错误地包含了参数更新操作，那可能会导致正常预测过程中参数被更改。
+这两个 :ref:`api_fluid_Program` 之间的关系类似于训练 :ref:`api_fluid_Program`
+和测试 :ref:`api_fluid_Program` 之间的关系，详见： :ref:`user_guide_test_while_training`。
+另外，需特别注意运行 :code:`fluid.default_startup_program()` 必须在调用 :code:`fluid.io.load_params`
+之前。如果在之后运行，可能会覆盖已加载的模型参数导致错误。
+载入checkpoint用于恢复训练
+==========================
+对于通过 :code:`fluid.io.save_checkpoint` 保存的模型，可以使用 :code:`fluid.io.load_checkpoint`
+来进行载入。
+例如：
+.. code-block:: python
+    import paddle.fluid as fluid
+    exe = fluid.Executor(fluid.CPUPlace())
+    path = "./checkpoints"
+    prog = fluid.default_main_program()
+    fluid.io.load_checkpoint(executor=exe, checkpoint_dir=path,
+                             serial=9, main_program=prog)
+上面的例子中，通过调用 :code:`fluid.io.save_checkpoint` 函数，PaddlePaddle Fluid会对
+:code:`prog` 中的所有模型变量进行扫描，根据内置规则自动筛选出需要加载的变量，
+并尝试从 :code:`path` 之中加载它们。
+参数 :code:`serial` 用来标记具体要加载的checkpoint的版本号。在保存checkpoint的时候，
+一个checkpoint会被保存在一个子目录中，并在目录名上体现出自己的版本号。
+一般越大的版本号表示这个checkpoint越新。
+这里的 :code:`prog` 必须和调用 :code:`fluid.io.save_checkpoint` 时所用的 :code:`prog`
+完全一致，否则会导致变量加载错误或者未加载。另外，与 :code:`fluid.io.save_params` 类似，
+运行 :code:`fluid.default_startup_program()` 也必须在 :code:`fluid.io.load_checkpoint`
+之前进行。
--- a/source/user_guides/howto/training/single_node.rst
+++ b/source/user_guides/howto/training/single_node.rst
+########
+单机训练
+########
+准备工作
+########
+要进行PaddlePaddle Fluid单机训练，需要先 :ref:`user_guide_prepare_data` 和
+:ref:`user_guide_configure_simple_model` 。当\
+:ref:`user_guide_configure_simple_model` 完毕后，可以得到两个\
+:ref:`api_fluid_Program`， :code:`startup_program` 和 :code:`main_program`。
+默认情况下，可以使用 :ref:`api_fluid_default_startup_program` 与\ :ref:`api_fluid_default_main_program` 获得全局的 :ref:`api_fluid_Program`。
+例如:
+.. code-block:: python
+   import paddle.fluid as fluid
+   image = fluid.layers.data(name="image", shape=[784])
+   label = fluid.layers.data(name="label", shape=[1])
+   hidden = fluid.layers.fc(input=image, size=100, act='relu')
+   prediction = fluid.layers.fc(input=hidden, size=10, act='softmax')
+   loss = fluid.layers.mean(
+       fluid.layers.cross_entropy(
+           input=prediction,
+           label=label
+       )
+   )
+   sgd = fluid.optimizer.SGD(learning_rate=0.001)
+   sgd.minimize(loss)
+   # Here the fluid.default_startup_program() and fluid.default_main_program()
+   # has been constructed.
+在上述模型配置执行完毕后， :code:`fluid.default_startup_program()` 与\
+:code:`fluid.default_main_program()` 配置完毕了。
+初始化参数
+##########
+参数随机初始化
+==============
+用户配置完模型后，参数初始化操作会被写入到\
+:code:`fluid.default_startup_program()` 中。使用 :ref:`api_fluid_Executor` 运行
+这一程序，即可在全局 :ref:`api_fluid_global_scope` 中随机初始化参数。例如:
+.. code-block:: python
+   exe = fluid.Executor(fluid.CUDAPlace(0))
+   exe.run(program=fluid.default_startup_program())
+值得注意的是: 如果使用多GPU训练，参数需要先在GPU0上初始化，再经由\
+:ref:`api_fluid_ParallelExecutor` 分发到多张显卡上。
+载入预定义参数
+==============
+在神经网络训练过程中，经常会需要载入预定义模型，进而继续进行训练。\
+如何载入预定义参数，请参考 :ref:`user_guide_save_load_vars`。
+单卡训练
+########
+执行单卡训练可以使用 :ref:`api_fluid_Executor` 中的 :code:`run()` 方法，运行训练\
+:ref:`api_fluid_Program` 即可。在运行的时候，用户可以通过 :code:`run(feed=...)`\
+参数传入数据；用户可以通过 :code:`run(fetch=...)` 获取持久的数据。例如:\
+.. code-block:: python
+   ...
+   loss = fluid.layers.mean(...)
+   exe = fluid.Executor(...)
+   # the result is an numpy array
+   result = exe.run(feed={"image": ..., "label": ...}, fetch_list=[loss])
+这里有几点注意事项:
+1. feed的数据格式，请参考文章 :ref:`user_guide_feed_data_to_executor`。
+2. :code:`Executor.run` 的返回值是 :code:`fetch_list=[...]` 的variable值。被fetch\
+   的Variable必须是persistable的。 :code:`fetch_list` 可以传入Variable的列表，\
+   也可以传入Variable的名字列表。:code:`Executor.run` 返回Fetch结果列表。
+3. 如果需要取回的数据包含序列信息，可以设置
+   :code:`exe.run(return_numpy=False, ...)` 直接返回 :ref:`api_guide_lod_tensor`
+   。用户可以直接访问 :ref:`api_guide_lod_tensor` 中的信息。
+多卡训练
+########
+执行多卡训练可以使用 :ref:`api_fluid_ParallelExecutor` 运行训练
+:ref:`api_fluid_Program`。例如:
+.. code-block:: python
+   train_exe = fluid.ParallelExecutor(use_cuda=True, loss_name=loss.name,
+                                main_program=fluid.default_main_program())
+   train_exe.run(fetch_list=[loss.name], feed={...})
+这里有几点注意事项:
+1. :code:`ParallelExecutor` 的构造函数需要指明要执行的 :ref:`api_fluid_Program` ,
+   并在执行过程中不能修改。默认值是 :ref:`api_fluid_default_main_program` 。
+2. :code:`ParallelExecutor` 需要明确指定是否使用 CUDA 显卡进行训练。在显卡训练\
+   模式下会占用全部显卡。用户可以配置 `CUDA_VISIBLE_DEVICES <http://www.acceleware.com/blog/cudavisibledevices-masking-gpus>`_ 来修改占用\
+   的显卡。
+进阶使用
+########
+.. toctree::
+   :maxdepth: 2
+   test_while_training
+   save_load_variables
--- a/source/user_guides/howto/training/test_while_training.rst
+++ b/source/user_guides/howto/training/test_while_training.rst
+.. _user_guide_test_while_training:
+##################
+训练过程中评测模型
+##################
+模型的测试评价与训练的 :ref:`api_fluid_Program` 不同。在测试评价中:
+1. 评价测试不进行反向传播，不优化更新参数。
+2. 评价测试执行的操作可以不同。
+   * 例如 BatchNorm 操作，在训练和测试时执行不同的算法。
+   * 评价模型与训练相比可以是完全不同的模型。
+生成测试 :ref:`api_fluid_Program`
+#################################
+通过克隆训练 :ref:`api_fluid_Program` 生成测试 :ref:`api_fluid_Program`
+=======================================================================
+:code:`Program.clone()` 方法可以复制出新的 :ref:`api_fluid_Program` 。 通过设置
+:code:`Program.clone(for_test=True)` 复制含有用于测试的操作Program。简单的使用方法如下:
+.. code-block:: python
+   import paddle.fluid as fluid
+   img = fluid.layers.data(name="image", shape=[784])
+   prediction = fluid.layers.fc(
+     input=fluid.layers.fc(input=img, size=100, act='relu'),
+     size=10,
+     act='softmax'
+   )
+   label = fluid.layers.data(name="label", shape=[1], dtype="int64")
+   loss = fluid.layers.mean(fluid.layers.cross_entropy(input=prediction, label=label))
+   acc = fluid.layers.accuracy(input=prediction, label=label)
+   test_program = fluid.default_main_program().clone(for_test=True)
+   adam = fluid.optimizer.Adam(learning_rate=0.001)
+   adam.minimize(loss)
+在使用 :code:`Optimizer` 之前，将 :code:`fluid.default_main_program()` 复制\
+成一个 :code:`test_program` 。之后使用测试数据运行 :code:`test_program`,\
+就可以做到运行测试程序，而不影响训练结果。
+分别配置训练 :ref:`api_fluid_Program` 和测试 :ref:`api_fluid_Program`
+=====================================================================
+如果训练程序和测试程序相差较大时，用户也可以通过完全定义两个不同的
+:ref:`api_fluid_Program`，分别进行训练和测试。在PaddlePaddle Fluid中，\
+所有的参数都有名字。如果两个不同的操作，甚至两个不同的网络使用了同样名字的参数，\
+那么他们的值和内存空间都是共享的。
+PaddlePaddle Fluid中使用 :code:`fluid.unique_name` 包来随机初始化用户未定义的\
+参数名称。通过 :code:`fluid.unique_name.guard` 可以确保多次调用某函数\
+参数初始化的名称一致。
+例如:
+.. code-block:: python
+   import paddle.fluid as fluid
+   def network(is_test):
+       file_obj = fluid.layers.open_files(filenames=["test.recordio"] if is_test else ["train.recordio"], ...)
+       img, label = fluid.layers.read_file(file_obj)
+       hidden = fluid.layers.fc(input=img, size=100, act="relu")
+       hidden = fluid.layers.batch_norm(input=hidden, is_test=is_test)
+       ...
+       return loss
+   with fluid.unique_name.guard():
+       train_loss = network(is_test=False)
+       sgd = fluid.optimizer.SGD(0.001)
+       sgd.minimize(train_loss)
+   test_program = fluid.Program()
+   with fluid.unique_name.guard():
+       with fluid.program_gurad(test_program, fluid.Program()):
+           test_loss = network(is_test=True)
+   # fluid.default_main_program() is the train program
+   # fluid.test_program is the test program
+执行测试 :ref:`api_fluid_Program`
+#################################
+使用 :code:`Executor` 执行测试 :ref:`api_fluid_Program`
+=======================================================
+用户可以使用 :code:`Executor.run(program=...)` 来执行测试
+:ref:`api_fluid_Program`。
+例如
+.. code-block:: python
+   exe = fluid.Executor(fluid.CPUPlace())
+   test_acc = exe.run(program=test_program, feed=test_data_batch, fetch_list=[acc])
+   print 'Test accuracy is ', test_acc
+使用 :code:`ParallelExecutor` 执行测试 :ref:`api_fluid_Program`
+===============================================================
+用户可以使用训练用的 :code:`ParallelExecutor` 与测试 :ref:`api_fluid_Program`
+一起新建一个测试的 :code:`ParallelExecutor` ；再使用测试
+:code:`ParallelExecutor.run` 来执行测试。
+例如:
+.. code-block:: python
+   train_exec = fluid.ParallelExecutor(use_cuda=True, loss_name=loss.name)
+   test_exec = fluid.ParallelExecutor(use_cuda=True, share_vars_from=train_exec,
+                                      main_program=test_program)
+   test_acc = test_exec.run(fetch_list=[acc], ...)