fix bugs

42f9ba10 · xixiaoyao · ada30bc3 · 42f9ba10 · 42f9ba10 · 42f9ba10
显示空白变更内容
内联并排

Showing with 4 addition and 4 deletion

paddlepalm/task_paradigm/mlm.py paddlepalm/task_paradigm/mlm.py +1 -0

paddlepalm/task_paradigm/mrc.py paddlepalm/task_paradigm/mrc.py +2 -0

run_demo2.sh run_demo2.sh +1 -4

未找到文件。
--- a/paddlepalm/task_paradigm/mlm.py
+++ b/paddlepalm/task_paradigm/mlm.py
@@ -57,6 +57,7 @@ class TaskParadigm(task_paradigm):
            # 多任务学习时才需要引入这个，防止其他run其他任务时导致seqlen过小，gather超范围
            max_position = inputs["reader"]["batchsize_x_seqlen"] - 1
            mask_pos = fluid.layers.elementwise_min(mask_pos, max_position)
+            mask_pos.stop_gradient = True
        word_emb = inputs["backbone"]["embedding_table"]
        enc_out = inputs["backbone"]["encoder_outputs"]

--- a/paddlepalm/task_paradigm/mrc.py
+++ b/paddlepalm/task_paradigm/mrc.py
@@ -80,6 +80,8 @@ class TaskParadigm(task_paradigm):
            max_position = inputs["reader"]["seqlen"] - 1
            start_positions = fluid.layers.elementwise_min(start_positions, max_position)
            end_positions = fluid.layers.elementwise_min(end_positions, max_position)
+            start_positions.stop_gradient = True
+            end_positions.stop_gradient = True
        else:
            unique_id = inputs['reader']['unique_ids']

--- a/run_demo2.sh
+++ b/run_demo2.sh
 export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
-while true
+python -u demo2.py 
-do
-    python -u demo2.py 
-done
 # GLOG_vmodule=lookup_table_op=4 python -u demo2.py > debug2.log 2>&1