run_multi.sh 436 字节
Newer Older
Z
Zhong Hui 已提交
1
unset CUDA_VISIBLE_DEVICES
2 3 4 5
python -m paddle.distributed.launch --gpus "0,1" run_pretrain.py \
    --model_type gpt2\
    --model_name_or_path gpt2-small-en\
    --input_dir "./data"\
Z
Zhong Hui 已提交
6 7 8 9 10 11 12 13 14 15 16
    --output_dir "output"\
    --max_lr 0.00015\
    --min_lr 0.00001\
    --weight_decay 0.01\
    --grad_clip 1.0\
    --max_steps 500000\
    --save_steps 100000\
    --decay_steps 320000\
    --warmup_rate 0.01\
    --batch_size 8\
    --device gpu