benchmark_train.sh 6.0 KB
Newer Older
1 2 3 4 5
#!/bin/bash
source test_tipc/common_func.sh

# run benchmark sh 
# Usage:
L
LDOUBLEV 已提交
6
# bash run_benchmark_train.sh config.txt params
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

function func_parser_params(){
    strs=$1
    IFS="="
    array=(${strs})
    tmp=${array[1]}
    echo ${tmp}
}

function func_sed_params(){
    filename=$1
    line=$2
    param_value=$3
    params=`sed -n "${line}p" $filename`
    IFS=":"
    array=(${params})
    key=${array[0]}
    value=${array[1]}
    if [[ $value =~ 'benchmark_train' ]];then
        IFS='='
        _val=(${value})
        param_value="${_val[0]}=${param_value}"
    fi
    new_params="${key}:${param_value}"
    IFS=";"
    cmd="sed -i '${line}s/.*/${new_params}/' '${filename}'"
    eval $cmd
}

function set_gpu_id(){
    string=$1
    _str=${string:1:6}
L
LDOUBLEV 已提交
39
    IFS="C"
40
    arr=(${_str})
L
LDOUBLEV 已提交
41
    M=${arr[0]}
42
    P=${arr[1]}
L
LDOUBLEV 已提交
43 44
    gn=`expr $P - 1`
    gpu_num=`expr $gn / $M`
45 46 47 48
    seq=`seq -s "," 0 $gpu_num`
    echo $seq
}

L
LDOUBLEV 已提交
49 50 51 52 53 54 55
function get_repo_name(){
    IFS=";"
    cur_dir=$(pwd)
    IFS="/"
    arr=(${cur_dir})
    echo ${arr[-1]}
}
56

L
LDOUBLEV 已提交
57 58 59 60 61
FILENAME=$1
# MODE be one of ['benchmark_train']
MODE=$2
params=$3
# bash test_tipc/benchmark_train.sh test_tipc/configs/det_mv3_db_v2.0/train_benchmark.txt  benchmark_train dynamic_bs8_null_SingleP_DP_N1C1
L
LDOUBLEV 已提交
62 63
IFS="\n"

L
LDOUBLEV 已提交
64 65 66
# FILENAME="test_tipc/configs/det_mv3_db_v2.0/train_benchmark.txt"
# MODE="benchmark_train"
# params="dynamic_bs8_fp32_SingleP_DP_N1C4"
L
LDOUBLEV 已提交
67 68 69 70 71 72 73 74 75 76 77 78 79 80

# parser params from input: modeltype_bs${bs_item}_${fp_item}_${run_process_type}_${run_mode}_${device_num}
IFS="_"
params_list=(${params})
model_type=${params_list[0]}
batch_size=${params_list[1]}
batch_size=`echo  ${batch_size} | tr -cd "[0-9]" `
precision=${params_list[2]}
run_process_type=${params_list[3]}
run_mode=${params_list[4]}
device_num=${params_list[5]}
device_num_copy=$device_num
IFS=";"

L
LDOUBLEV 已提交
81

L
LDOUBLEV 已提交
82 83 84 85 86 87 88 89 90 91 92 93 94 95 96
# sed batchsize and precision
func_sed_params "$FILENAME" "6" "$precision"
func_sed_params "$FILENAME" "9" "$batch_size"

# parser params from train_benchmark.txt
dataline=`cat $FILENAME`
# parser params
IFS=$'\n'
lines=(${dataline})
model_name=$(func_parser_value "${lines[1]}")

# 获取benchmark_params所在的行数
line_num=`grep -n "benchmark_params" $FILENAME  | cut -d ":" -f 1`
# for train log parser
line_num=`expr $line_num + 3`
L
LDOUBLEV 已提交
97
speed_unit_value=$(func_parser_value "${lines[line_num]}")
L
LDOUBLEV 已提交
98 99 100 101 102 103

line_num=`expr $line_num + 1`
skip_steps_value=$(func_parser_value "${lines[line_num]}")

line_num=`expr $line_num + 1`
keyword_value=$(func_parser_value "${lines[line_num]}")
L
LDOUBLEV 已提交
104
echo $keyword_value
L
LDOUBLEV 已提交
105 106 107 108 109 110 111 112 113 114 115

line_num=`expr $line_num + 1`
convergence_key_value=$(func_parser_value "${lines[line_num]}")

line_num=`expr $line_num + 1`
flags_value=$(func_parser_value "${lines[line_num]}")

gpu_id=$(set_gpu_id $device_num)
repo_name=$(get_repo_name )

SAVE_LOG="benchmark_log"
L
LDOUBLEV 已提交
116
status_log="benchmark_log/results.log"
L
LDOUBLEV 已提交
117

L
LDOUBLEV 已提交
118 119 120 121 122 123 124 125 126
# set export 
IFS=";"
flags_list=(${flags_value})
for _flag in ${flags_list[*]}; do
    cmd="export ${_flag}"
    echo $cmd
    eval $cmd
done

L
LDOUBLEV 已提交
127 128 129 130
if [ ${precision} = "null" ];then
    precision="fp32"
fi

L
LDOUBLEV 已提交
131 132 133 134 135
if [ ${#gpu_id} -le 1 ];then
    log_path="$SAVE_LOG/profiling_log"
    mkdir -p $log_path
    log_name="${repo_name}_${model_name}_bs${batch_size}_${precision}_${run_process_type}_${run_mode}_${device_num}_profiling"
    func_sed_params "$FILENAME" "4" "0"  # sed used gpu_id 
L
LDOUBLEV 已提交
136
    cmd="bash test_tipc/test_train_inference_python.sh ${FILENAME} benchmark_train > ${log_path}/${log_name} 2>&1 "
L
LDOUBLEV 已提交
137
    echo $cmd
L
LDOUBLEV 已提交
138
    eval $cmd
L
LDOUBLEV 已提交
139
    eval "cat ${log_path}/${log_name}"
L
LDOUBLEV 已提交
140

L
LDOUBLEV 已提交
141 142 143 144
    # without profile
    log_path="$SAVE_LOG/train_log"
    mkdir -p $log_path
    log_name="${repo_name}_${model_name}_bs${batch_size}_${precision}_${run_process_type}_${run_mode}_${device_num}_log"
L
LDOUBLEV 已提交
145
    speed_log_name=log_name="${repo_name}_${model_name}_bs${batch_size}_${precision}_${run_process_type}_${run_mode}_${device_num}_speed"
L
LDOUBLEV 已提交
146
    func_sed_params "$FILENAME" "13" "null"  # sed used gpu_id 
L
LDOUBLEV 已提交
147
    cmd="bash test_tipc/test_train_inference_python.sh ${FILENAME} benchmark_train > ${log_path}/${log_name} 2>&1 "
L
LDOUBLEV 已提交
148
    echo $cmd
L
LDOUBLEV 已提交
149
    eval $cmd
L
LDOUBLEV 已提交
150
    eval "cat ${log_path}/${log_name}"
L
LDOUBLEV 已提交
151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170

    # echo "debug"
    # parser log
    _model_name="${model_name}_bs${batch_size}_${precision}_${run_process_type}_${run_mode}"
    cmd="python3.7 analysis.py --filename ${log_path}/${log_name} \
            --speed_log_file '${log_path}/${speed_log_name}' \
            --model_name ${_model_name} \
            --base_batch_size ${batch_size} \
            --run_mode ${run_mode} \
            --run_process_type ${run_process_type} \
            --fp_item ${precision} \
            --keyword ${keyword_value}: \
            --skip_steps ${skip_steps_value} \
            --device_num ${device_num} \
            --speed_unit ${speed_unit_value} \
            --convergence_key ${convergence_key_value}: "
    echo $cmd
    eval $cmd
    

L
LDOUBLEV 已提交
171 172 173 174
else
    log_path="$SAVE_LOG/train_log"
    mkdir -p $log_path
    log_name="${repo_name}_${model_name}_bs${batch_size}_${precision}_${run_process_type}_${run_mode}_${device_num}_log"
L
LDOUBLEV 已提交
175
    speed_log_name=log_name="${repo_name}_${model_name}_bs${batch_size}_${precision}_${run_process_type}_${run_mode}_${device_num}_speed"
L
LDOUBLEV 已提交
176
    func_sed_params "$FILENAME" "4" "$gpu_id"  # sed used gpu_id 
L
LDOUBLEV 已提交
177
    func_sed_params "$FILENAME" "13" "null"  # sed --profile_option as null
L
LDOUBLEV 已提交
178
    cmd="bash test_tipc/test_train_inference_python.sh ${FILENAME} benchmark_train > ${log_path}/${log_name} 2>&1 "
L
LDOUBLEV 已提交
179
    echo $cmd
L
LDOUBLEV 已提交
180
    eval $cmd
L
LDOUBLEV 已提交
181
    eval "cat ${log_path}/${log_name}"
L
LDOUBLEV 已提交
182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198
    # parser log
    _model_name="${model_name}_bs${batch_size}_${precision}_${run_process_type}_${run_mode}"
    
    cmd="python3.7 analysis.py --filename ${log_path}/${log_name} \
            --speed_log_file '${log_path}/${speed_log_name}' \
            --model_name ${_model_name} \
            --base_batch_size ${batch_size} \
            --run_mode ${run_mode} \
            --run_process_type ${run_process_type} \
            --fp_item ${precision} \
            --keyword ${keyword_value}: \
            --skip_steps ${skip_steps_value} \
            --device_num ${device_num} \
            --speed_unit ${speed_unit_value} \
            --convergence_key ${convergence_key_value}: "
    echo $cmd
    eval $cmd
199

L
LDOUBLEV 已提交
200
fi
201