ResNet50_fp16.sh 1.1 KB
Newer Older
1 2 3 4 5
#!/bin/bash -ex

export FLAGS_conv_workspace_size_limit=4000 #MB
export FLAGS_cudnn_exhaustive_search=1
export FLAGS_cudnn_batchnorm_spatial_persistent=1
Z
zhiqiu 已提交
6
export FLAGS_max_inplace_grad_add=8
7

Z
zhiqiu 已提交
8
DATA_DIR="./data/ILSVRC2012/"
9 10 11 12 13 14 15 16 17 18 19 20

DATA_FORMAT="NHWC"
USE_FP16=true #whether to use float16
USE_DALI=true

if ${USE_DALI}; then
    export FLAGS_fraction_of_gpu_memory_to_use=0.8
fi

python train.py \
       --model=ResNet50 \
       --data_dir=${DATA_DIR} \
Z
zhiqiu 已提交
21
       --batch_size=128 \
22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
       --total_images=1281167 \
       --image_shape 3 224 224 \
       --class_dim=1000 \
       --print_step=10 \
       --model_save_dir=output/ \
       --lr_strategy=piecewise_decay \
       --use_fp16=${USE_FP16} \
       --scale_loss=128.0 \
       --use_dynamic_loss_scaling=true \
       --data_format=${DATA_FORMAT} \
       --fuse_elewise_add_act_ops=true \
       --fuse_bn_act_ops=true \
       --validate=true \
       --is_profiler=false \
       --profiler_path=profile/ \
       --reader_thread=10 \
       --reader_buf_size=4000 \
       --use_dali=${USE_DALI} \
Z
zhiqiu 已提交
40 41
       --fuse_all_optimizer_ops=true \
       --enable_addto=true \
42 43
       --lr=0.1