From 5678d3f090009e892eae39ccd6e02d7554a99705 Mon Sep 17 00:00:00 2001
From: Li Fuchen <lfchener@outlook.com>
Date: Thu, 2 Apr 2020 18:54:37 +0800
Subject: [PATCH] fix a save/load bug of language model (#4511)

---
 PaddleNLP/language_model/train.py                          | 2 +-
 PaddleNLP/shared_modules/models/language_model/lm_model.py | 4 ----
 2 files changed, 1 insertion(+), 5 deletions(-)

diff --git a/PaddleNLP/language_model/train.py b/PaddleNLP/language_model/train.py
index 9a5af4b7..3cc04364 100644
--- a/PaddleNLP/language_model/train.py
+++ b/PaddleNLP/language_model/train.py
@@ -178,7 +178,7 @@ def main():
             print(args.init_from_pretrain_model)
             raise Warning("The pretrained params do not exist.")
             return
-        fluid.load(main_program, args.init_from_pretrain_model)
+        fluid.load(main_program, args.init_from_pretrain_model, exe)
         print("finish initing model from pretrained params from %s" %
               (args.init_from_pretrain_model))
 
diff --git a/PaddleNLP/shared_modules/models/language_model/lm_model.py b/PaddleNLP/shared_modules/models/language_model/lm_model.py
index c66b77b7..decad759 100644
--- a/PaddleNLP/shared_modules/models/language_model/lm_model.py
+++ b/PaddleNLP/shared_modules/models/language_model/lm_model.py
@@ -241,8 +241,6 @@ def lm_model(hidden_size,
         name="init_cell",
         shape=[None, num_layers, hidden_size],
         dtype='float32')
-    init_cell.persistable = True
-    init_hidden.persistable = True
 
     init_hidden = layers.transpose(init_hidden, perm=[1, 0, 2])
     init_cell = layers.transpose(init_cell, perm=[1, 0, 2])
@@ -334,8 +332,6 @@ def lm_model(hidden_size,
     loss = layers.reduce_sum(loss)
 
     loss.persistable = True
-    last_cell.persistable = True
-    last_hidden.persistable = True
 
     # This will feed last_hidden, last_cell to init_hidden, init_cell, which
     # can be used directly in next batch. This can avoid the fetching of
-- 
GitLab