Merge pull request #5148 from tensor-tang/benchmark

update benchmark data on VGG19

Merge pull request #5148 from tensor-tang/benchmark
update benchmark data on VGG19
a3435044 · tensor-tang · GitHub · 2e74cf46 · 5bd18865 · a3435044
隐藏空白更改
内联并排

Showing with 48 addition and 0 deletion

benchmark/IntelOptimizedPaddle.md benchmark/IntelOptimizedPaddle.md +48 -0

未找到文件。
--- a/benchmark/IntelOptimizedPaddle.md
+++ b/benchmark/IntelOptimizedPaddle.md
+# Benchmark
+Machine:
+- Server
+ 	- Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 2 Sockets, 20 Cores per socket
+- Laptop
+ 	- DELL XPS15-9560-R1745: i7-7700HQ 8G 256GSSD
+ 	- i5 MacBook Pro (Retina, 13-inch, Early 2015)
+- Desktop
+ 	- i7-6700k
+System: CentOS release 6.3 (Final), Docker 1.12.1.
+PaddlePaddle: paddlepaddle/paddle:latest (TODO: will rerun after 0.11.0)
+- MKL-DNN tag v0.10
+- MKLML 2018.0.20170720
+- OpenBLAS v0.2.20
+On each machine, we will test and compare the performance of training on single node using MKL-DNN / MKLML / OpenBLAS respectively.
+## Benchmark Model
+### Server
+Test on batch size 64, 128, 256 on Intel(R) Xeon(R) Gold 6148M CPU @ 2.40GHz
+Input image size - 3 * 224 * 224, Time: images/second
+- VGG-19
+| BatchSize    | 64    | 128  | 256     |
+|--------------|-------| -----| --------|
+| OpenBLAS     | 7.82  | 8.62  | 10.34  | 
+| MKLML        | 11.02 | 12.86 | 15.33  |
+| MKL-DNN      | 27.69 | 28.8 | 29.27  |
+chart on batch size 128
+TBD
+ - ResNet
+ - GoogLeNet
+### Laptop
+TBD
+### Desktop
+TBD