Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
Paddle
提交
4df0bb33
P
Paddle
项目概览
BaiXuePrincess
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
4df0bb33
编写于
12月 07, 2017
作者:
T
Tao Luo
提交者:
GitHub
12月 07, 2017
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #6381 from luotao1/intel_graph
add graph in IntelOptimizedReadme
上级
8193cc55
2f07e6cc
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
11 addition
and
22 deletion
+11
-22
benchmark/IntelOptimizedPaddle.md
benchmark/IntelOptimizedPaddle.md
+11
-22
benchmark/figs/googlenet-cpu-train.png
benchmark/figs/googlenet-cpu-train.png
+0
-0
benchmark/figs/resnet-cpu-train.png
benchmark/figs/resnet-cpu-train.png
+0
-0
benchmark/figs/vgg-cpu-train.png
benchmark/figs/vgg-cpu-train.png
+0
-0
未找到文件。
benchmark/IntelOptimizedPaddle.md
浏览文件 @
4df0bb33
...
@@ -2,21 +2,17 @@
...
@@ -2,21 +2,17 @@
Machine:
Machine:
-
Server
-
Server: Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 2 Sockets, 20 Cores per socket
-
Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 2 Sockets, 20 Cores per socket
-
Laptop: TBD
-
Laptop
-
DELL XPS15-9560-R1745: i7-7700HQ 8G 256GSSD
-
i5 MacBook Pro (Retina, 13-inch, Early 2015)
-
Desktop
-
i7-6700k
System: CentOS release 6.3 (Final), Docker 1.12.1.
System: CentOS release 6.3 (Final), Docker 1.12.1.
PaddlePaddle: paddlepaddle/paddle:latest (for MKLML and MKL-DNN), paddlepaddle/paddle:latest-openblas (for OpenBLAS)
PaddlePaddle: (TODO: will rerun after 0.11.0)
-
MKL-DNN tag v0.11
-
paddlepaddle/paddle:latest (for MKLML and MKL-DNN)
-
MKLML 2018.0.1.20171007
-
MKL-DNN tag v0.11
-
OpenBLAS v0.2.20
-
MKLML 2018.0.1.20171007
(TODO: will rerun after 0.11.0)
-
paddlepaddle/paddle:latest-openblas (for OpenBLAS)
-
OpenBLAS v0.2.20
On each machine, we will test and compare the performance of training on single node using MKL-DNN / MKLML / OpenBLAS respectively.
On each machine, we will test and compare the performance of training on single node using MKL-DNN / MKLML / OpenBLAS respectively.
...
@@ -35,9 +31,7 @@ Input image size - 3 * 224 * 224, Time: images/second
...
@@ -35,9 +31,7 @@ Input image size - 3 * 224 * 224, Time: images/second
| MKLML | 12.12 | 13.70 | 16.18 |
| MKLML | 12.12 | 13.70 | 16.18 |
| MKL-DNN | 28.46 | 29.83 | 30.44 |
| MKL-DNN | 28.46 | 29.83 | 30.44 |
<img
src=
"figs/vgg-cpu-train.png"
width=
"500"
>
chart on batch size 128
TBD
-
ResNet-50
-
ResNet-50
...
@@ -47,9 +41,7 @@ TBD
...
@@ -47,9 +41,7 @@ TBD
| MKLML | 32.52 | 31.89 | 33.12 |
| MKLML | 32.52 | 31.89 | 33.12 |
| MKL-DNN | 81.69 | 82.35 | 84.08 |
| MKL-DNN | 81.69 | 82.35 | 84.08 |
<img
src=
"figs/resnet-cpu-train.png"
width=
"500"
>
chart on batch size 128
TBD
-
GoogLeNet
-
GoogLeNet
...
@@ -59,10 +51,7 @@ TBD
...
@@ -59,10 +51,7 @@ TBD
| MKLML | 128.46| 137.89| 158.63 |
| MKLML | 128.46| 137.89| 158.63 |
| MKL-DNN | 250.46| 264.83| 269.50 |
| MKL-DNN | 250.46| 264.83| 269.50 |
chart on batch size 128
<img
src=
"figs/googlenet-cpu-train.png"
width=
"500"
>
TBD
### Laptop
### Laptop
TBD
TBD
### Desktop
TBD
benchmark/figs/googlenet-cpu-train.png
0 → 100644
浏览文件 @
4df0bb33
17.8 KB
benchmark/figs/resnet-cpu-train.png
0 → 100644
浏览文件 @
4df0bb33
19.8 KB
benchmark/figs/vgg-cpu-train.png
0 → 100644
浏览文件 @
4df0bb33
17.9 KB
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录