fix fc/gru bias parameter

f4188f73 · zhangwenhui03 · 84edc6f7 · f4188f73
隐藏空白更改
内联并排

Showing with 15 addition and 11 deletion

fluid/PaddleRec/multiview_simnet/nets.py fluid/PaddleRec/multiview_simnet/nets.py +15 -11

未找到文件。
--- a/fluid/PaddleRec/multiview_simnet/nets.py
+++ b/fluid/PaddleRec/multiview_simnet/nets.py
@@ -33,7 +33,7 @@ class CNNEncoder(object):
    """ cnn-encoder"""

    def __init__(self,
-                 param_name="cnn.w",
+                 param_name="cnn",
                 win_size=3,
                 ksize=128,
                 act='tanh',
@@ -51,13 +51,15 @@ class CNNEncoder(object):
            filter_size=self.win_size,
            act=self.act,
            pool_type=self.pool_type,
-            param_attr=str(self.param_name))
+            param_attr=str(str(self.param_name) + "_param"),
+            bias_attr=str(str(self.param_name) + "_bias"))
+        


 class GrnnEncoder(object):
    """ grnn-encoder """

-    def __init__(self, param_name="grnn.w", hidden_size=128):
+    def __init__(self, param_name="grnn", hidden_size=128):
        self.param_name = param_name
        self.hidden_size = hidden_size

@@ -65,13 +67,15 @@ class GrnnEncoder(object):
        fc0 = nn.fc(
            input=emb, 
            size=self.hidden_size * 3, 
-            param_attr=str(str(self.param_name) + "_fc")
+            param_attr=str(str(self.param_name) + "_fc.w"),
+            bias_attr=str(str(self.param_name) + "_fc.b")
        )
        gru_h = nn.dynamic_gru(
            input=fc0,
            size=self.hidden_size,
            is_reverse=False,
-            param_attr=str(self.param_name))
+            param_attr=str(str(self.param_name) + ".param"),
+            bias_attr=str(str(self.param_name) + ".bias"))
        return nn.sequence_pool(input=gru_h, pool_type='max')


@@ -139,17 +143,17 @@ class MultiviewSimnet(object):
        # lookup embedding for each slot
        q_embs = [
            nn.embedding(
-                input=query, size=self.emb_shape, param_attr="emb.w")
+                input=query, size=self.emb_shape, param_attr="emb")
            for query in q_slots
        ]
        pt_embs = [
            nn.embedding(
-                input=title, size=self.emb_shape, param_attr="emb.w")
+                input=title, size=self.emb_shape, param_attr="emb")
            for title in pt_slots
        ]
        nt_embs = [
            nn.embedding(
-                input=title, size=self.emb_shape, param_attr="emb.w")
+                input=title, size=self.emb_shape, param_attr="emb")
            for title in nt_slots
        ]

@@ -170,9 +174,9 @@ class MultiviewSimnet(object):
        nt_concat = nn.concat(nt_encodes)

        # projection of hidden layer
-        q_hid = nn.fc(q_concat, size=self.hidden_size, param_attr='q_fc.w')
-        pt_hid = nn.fc(pt_concat, size=self.hidden_size, param_attr='t_fc.w')
-        nt_hid = nn.fc(nt_concat, size=self.hidden_size, param_attr='t_fc.w')
+        q_hid = nn.fc(q_concat, size=self.hidden_size, param_attr='q_fc.w', bias_attr='q_fc.b')
+        pt_hid = nn.fc(pt_concat, size=self.hidden_size, param_attr='t_fc.w', bias_attr='t_fc.b')
+        nt_hid = nn.fc(nt_concat, size=self.hidden_size, param_attr='t_fc.w', bias_attr='t_fc.b')

        # cosine of hidden layers
        cos_pos = nn.cos_sim(q_hid, pt_hid)