From ef3f81781e7c5aff70a359fe63e84a6034cdc340 Mon Sep 17 00:00:00 2001
From: jiangjiajun <jiangjiajun@baidu.com>
Date: Fri, 28 Jun 2019 15:46:31 +0800
Subject: [PATCH] add md

---
 tensorflow2fluid/doc/tf.nn.rnn.GRUCell.md | 83 +++++++++++++++++++++++
 1 file changed, 83 insertions(+)
 create mode 100644 tensorflow2fluid/doc/tf.nn.rnn.GRUCell.md

diff --git a/tensorflow2fluid/doc/tf.nn.rnn.GRUCell.md b/tensorflow2fluid/doc/tf.nn.rnn.GRUCell.md
new file mode 100644
index 0000000..b6a0c60
--- /dev/null
+++ b/tensorflow2fluid/doc/tf.nn.rnn.GRUCell.md
@@ -0,0 +1,83 @@
+## tf.contrib.rnn.GRUCell
+
+### [tf.nn.rnn.GRUCell](https://www.tensorflow.org/versions/r1.13/api_docs/python/tf/nn/rnn_cell/GRUCell)
+
+```python
+__init__(
+    num_units,
+    activation=None,
+    reuse=None,
+    kernel_initializer=None,
+    bias_initializer=None,
+    name=None,
+    dtype=None,
+    **kwargs
+)
+```
+
+### [paddle.fluid.layers.gru_unit](http://paddlepaddle.org/documentation/docs/zh/1.4/api_cn/layers_cn.html#gru-unit)
+
+```python
+paddle.fluid.layers.gru_unit(
+    input, 
+    hidden, 
+    size, 
+    param_attr=None, 
+    bias_attr=None, 
+    activation='tanh', 
+    gate_activation='sigmoid', 
+    origin_mode=False
+)
+```
+
+### 功能差异
+
+#### 实现方式
+TensorFlow：GRU的实现方式见论文[Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation](http://arxiv.org/abs/1406.1078)；  
+PaddlePaddle：GRU有两种实现方式，当设置`origin_mode=False`时，与TensorFlow实现方式一致；当设置`origin_mode=True`时，实现方式则参考论文[Empirical Evaluation of
+Gated Recurrent Neural Networks
+on Sequence Modeling](https://arxiv.org/pdf/1412.3555.pdf)。
+
+
+#### 使用方式
+TensorFlow：首先定义`GRUCell`对象，定义对象时只需要指定单元数`num_units`；由于`GRUCell`内部定义了`__call__`方法，因而其对象是可调用对象，直接使用`step_output, cur_state = cell(step_input, last_state)`的形式，可以计算得到当前步的输出与状态;  
+
+PaddlePaddle：提供op形式的调用接口，通常与[paddle.fluid.layers.DynamicRNN](http://paddlepaddle.org/documentation/docs/zh/1.4/api_cn/layers_cn.html#dynamicrnn)配合使用，以获取序列中的单步输入。**注意，为了提高`gru_unit`的计算效率，用户在使用该接口时需要遵从如下约定：假设要指定的GRU单元数为`num_units`，则`size`以及`input.shape[-1]`必须为`3*num_units`，`hidden.shape[-1]`为`num_units`，见如下代码示例小节。**
+
+#### 返回值
+TensorFlow：返回一个二元组，分别是当前时刻的输出值与隐藏状态，实际上输出值与隐藏状态为相同的tensor；  
+PaddlePaddle：返回一个三元组，即`(hidden_value, reset_hidden_value, gate_value)`。后面两个元素为内部使用，用户可以只关注第一个元素。
+
+
+### 代码示例
+```
+emb_size = 32                                                                                                                                                                                                                                 
+emb_vocab = 10000                                                                                                                                                                                                                             
+num_unit_0 = 10                                                                                                                                                                                                                               
+                                                                                                                                                                                                                                              
+data = fluid.layers.data(name='input', shape=[1], dtype='int64', lod_level=1)                                                                                                                                                                 
+embedding = fluid.layers.embedding(input=data, size=[emb_vocab, emb_size],                                                                                                                                                                    
+                                    is_sparse=False)                                                                                                                                                                                          
+
+# 为了调用gru_unit，输入最后的维度必须为实际单元数的3倍
+emb_fc = layers.fc(embedding, num_unit_0 * 3)                                                                                                                                                                                                                                                                                                                                                        
+                                                                                                                                                                                                                                              
+drnn = fluid.layers.DynamicRNN()                                                                                                                                                                                                              
+with drnn.block():                                                                                                                                                                                                                            
+    word = drnn.step_input(emb_fc) 
+        
+    # 指定上一时刻的隐状态，单元数为num_unit_0                                                                                                                                                                                                       
+    prev_hid0 = drnn.memory(shape=[num_unit_0])                                                                                                                                                                                           
+        
+    # 执行gru_unit计算，num_unit_0 为实际的单元数                                                                                                                                                                                                                                      
+    cur_hid0, _, _ = layers.gru_unit(word, prev_hid0, num_unit_0 * 3)
+        
+    # 更新隐状态                                                                                                                                                                                                                                              
+    drnn.update_memory(prev_hid0, cur_hid0)                                                                                                                                                                                               
+                                                                                                                                                                                                                                              
+    drnn.output(cur_hid0)                                                                                                                                                                                                                 
+                                                                                                                                                                                                                                              
+out = drnn()                                                                                                                                                                                                                                  
+last = fluid.layers.sequence_last_step(out)                       
+
+```
-- 
GitLab