Fixed a bug of mixing forward and backward projection in bi-directional GRUs.

aed0cc99 · Xinghai Sun · d7a2c0e9 · aed0cc99
隐藏空白更改
内联并排

Showing with 12 addition and 5 deletion

layer.py layer.py +12 -5

未找到文件。
--- a/layer.py
+++ b/layer.py
@@ -84,19 +84,26 @@ def bidirectional_gru_bn_layer(name, input, size, act):
    :rtype: LayerOutput
    """
    # input-hidden weights shared across bi-direcitonal rnn.
-    input_proj = paddle.layer.fc(
+    input_proj_forward = paddle.layer.fc(
+        input=input,
+        size=size * 3,
+        act=paddle.activation.Linear(),
+        bias_attr=False)
+    input_proj_backward = paddle.layer.fc(
        input=input,
        size=size * 3,
        act=paddle.activation.Linear(),
        bias_attr=False)
    # batch norm is only performed on input-state projection
-    input_proj_bn = paddle.layer.batch_norm(
+    input_proj_bn_forward = paddle.layer.batch_norm(
-        input=input_proj, act=paddle.activation.Linear())
+        input=input_proj_forward, act=paddle.activation.Linear())
+    input_proj_bn_backward = paddle.layer.batch_norm(
+        input=input_proj_backward, act=paddle.activation.Linear())
    # forward and backward in time
    forward_gru = paddle.layer.grumemory(
-        input=input_proj_bn, act=act, reverse=False)
+        input=input_proj_bn_forward, act=act, reverse=False)
    backward_gru = paddle.layer.grumemory(
-        input=input_proj_bn, act=act, reverse=True)
+        input=input_proj_bn_backward, act=act, reverse=True)
    return paddle.layer.concat(input=[forward_gru, backward_gru])