WITH_MKLDNN=ON 导致模型变慢
Created by: velconia
排查发现,WITH_MKL=ON时,FLAGS_initial_cpu_memory_in_mb会被设置为 5000
所以所有使用 py_reader double_buffer 的模型在训练时,都会初始化 5G 的内存,用于set tensor;
消耗过大,而且由于allocator性能的原因,这也会导致速度降低;
workaround:
- 手动改小 FLAGS_initial_cpu_memory_in_mb 值,提升性能;
带 fix 问题:
- 提升allocator性能,MaxSize变大时也能保证性能;
- WITH_MKL=ON时,不应该设置更大的FLAGS_initial_cpu_memory_in_mb; 浪费内存