不同编译环境编译出来的paddle_trainer性能差别较大
Created by: linrongyi
用wangyanfei同学编译的出来的paddle_trainer 和我cmake出来的paddle_trainer训练性能差别很大
相同的数据, 一个pass:
wangyanfei: 22s me: 35s
另外, 编译出来的paddle_trainer的大小也差别很大
me: 22M wangyanfei: 130MB
trainer的参数为
${TRAINER_BIN} --config=trainer_config.conf --save_dir=output --trainer_count=11 --parallel_thread_num=1 --use_old_updater=1 --use_gpu=0 --save_dir=./output --enable_grad_share=0 --dot_period=200 --log_period=2000 --num_passes=1
我编译的版本, 已经开启了release选项, 使用mkl lib