fix lm

70e77f98 · Xin Pan · 3eacba37 · 70e77f98
隐藏空白更改
内联并排

Showing with 11 addition and 6 deletion

fluid/language_model/train.py fluid/language_model/train.py +11 -6

未找到文件。
--- a/fluid/language_model/train.py
+++ b/fluid/language_model/train.py
@@ -21,6 +21,11 @@ def parse_args():
        action='store_true',
        help='If set, run \
        the task with continuous evaluation logs.')
+    parser.add_argument(
+        '--num_devices',
+        type=int,
+        default=1,
+        help='Number of GPU devices')
    args = parser.parse_args()
    return args
@@ -132,7 +137,7 @@ def train(train_reader,
                "src_wordseq": lod_src_wordseq,
                "dst_wordseq": lod_dst_wordseq
            },
-                                         fetch_list=fetch_list)
+                fetch_list=fetch_list)
            avg_ppl = np.exp(ret_avg_cost[0])
            newest_ppl = np.mean(avg_ppl)
            if i % 100 == 0:
@@ -153,7 +158,7 @@ def train(train_reader,
                print("kpis	imikolov_20_avg_ppl	%s" % newest_ppl)
            else:
                print("kpis	imikolov_20_pass_duration_card%s	%s" % \
-                                (gpu_num, total_time / epoch_idx))
+                      (gpu_num, total_time / epoch_idx))
                print("kpis	imikolov_20_avg_ppl_card%s	%s" %
                      (gpu_num, newest_ppl))
        save_dir = "%s/epoch_%d" % (model_dir, epoch_idx)
@@ -165,13 +170,13 @@ def train(train_reader,
    print("finish training")
-def get_cards(enable_ce):
+def get_cards(args):
-    if enable_ce:
+    if args.enable_ce:
        cards = os.environ.get('CUDA_VISIBLE_DEVICES')
        num = len(cards.split(","))
        return num
    else:
-        return fluid.core.get_cuda_device_count()
+        return args.num_devices
 def train_net():
@@ -179,7 +184,7 @@ def train_net():
    batch_size = 20
    args = parse_args()
    vocab, train_reader, test_reader = utils.prepare_data(
-        batch_size=batch_size * get_cards(args.enable_ce), buffer_size=1000, \
+        batch_size=batch_size * get_cards(args), buffer_size=1000, \
        word_freq_threshold=0, enable_ce = args.enable_ce)
    train(
        train_reader=train_reader,