Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
Paddle
提交
24920c32
P
Paddle
项目概览
BaiXuePrincess
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
24920c32
编写于
1月 08, 2018
作者:
L
Luo Tao
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update openblas benchmark when export OPENBLAS_MAIN_FREE=1
上级
e94db381
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
11 addition
and
10 deletion
+11
-10
benchmark/IntelOptimizedPaddle.md
benchmark/IntelOptimizedPaddle.md
+10
-10
benchmark/paddle/image/run_openblas_infer.sh
benchmark/paddle/image/run_openblas_infer.sh
+1
-0
未找到文件。
benchmark/IntelOptimizedPaddle.md
浏览文件 @
24920c32
...
@@ -7,11 +7,11 @@ Machine:
...
@@ -7,11 +7,11 @@ Machine:
System: CentOS release 6.3 (Final), Docker 1.12.1.
System: CentOS release 6.3 (Final), Docker 1.12.1.
PaddlePaddle:
(TODO: will rerun after 0.11.0)
PaddlePaddle:
-
paddlepaddle/paddle:
latest
(for MKLML and MKL-DNN)
-
paddlepaddle/paddle:
0.11.0
(for MKLML and MKL-DNN)
-
MKL-DNN tag v0.11
-
MKL-DNN tag v0.11
-
MKLML 2018.0.1.20171007
-
MKLML 2018.0.1.20171007
-
paddlepaddle/paddle:
latest
-openblas (for OpenBLAS)
-
paddlepaddle/paddle:
0.11.0
-openblas (for OpenBLAS)
-
OpenBLAS v0.2.20
-
OpenBLAS v0.2.20
On each machine, we will test and compare the performance of training on single node using MKL-DNN / MKLML / OpenBLAS respectively.
On each machine, we will test and compare the performance of training on single node using MKL-DNN / MKLML / OpenBLAS respectively.
...
@@ -56,11 +56,11 @@ Input image size - 3 * 224 * 224, Time: images/second
...
@@ -56,11 +56,11 @@ Input image size - 3 * 224 * 224, Time: images/second
<img
src=
"figs/googlenet-cpu-train.png"
width=
"500"
>
<img
src=
"figs/googlenet-cpu-train.png"
width=
"500"
>
-
Alex
n
et
-
Alex
N
et
| BatchSize | 64 | 128 | 256 |
| BatchSize | 64 | 128 | 256 |
|--------------|--------| ------ | -------|
|--------------|--------| ------ | -------|
| OpenBLAS |
2.13 | 2.45 | 2.68
|
| OpenBLAS |
45.62 | 72.79 | 107.22
|
| MKLML | 66.37 | 105.60 | 144.04 |
| MKLML | 66.37 | 105.60 | 144.04 |
| MKL-DNN | 399.00 | 498.94 | 626.53 |
| MKL-DNN | 399.00 | 498.94 | 626.53 |
...
@@ -72,7 +72,7 @@ Test on batch size 1, 2, 4, 8, 16 on Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
...
@@ -72,7 +72,7 @@ Test on batch size 1, 2, 4, 8, 16 on Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
| BatchSize | 1 | 2 | 4 | 8 | 16 |
| BatchSize | 1 | 2 | 4 | 8 | 16 |
|-----------|-------|-------|-------|-------|-------|
|-----------|-------|-------|-------|-------|-------|
| OpenBLAS | 1.
07 | 1.08 | 1.06 | 0.88 | 0.6
5 |
| OpenBLAS | 1.
10 | 1.96 | 3.62 | 3.63 | 2.2
5 |
| MKLML | 5.58 | 9.80 | 15.15 | 21.21 | 28.67 |
| MKLML | 5.58 | 9.80 | 15.15 | 21.21 | 28.67 |
| MKL-DNN | 75.07 | 88.64 | 82.58 | 92.29 | 96.75 |
| MKL-DNN | 75.07 | 88.64 | 82.58 | 92.29 | 96.75 |
...
@@ -80,7 +80,7 @@ Test on batch size 1, 2, 4, 8, 16 on Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
...
@@ -80,7 +80,7 @@ Test on batch size 1, 2, 4, 8, 16 on Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
| BatchSize | 1 | 2 | 4 | 8 | 16 |
| BatchSize | 1 | 2 | 4 | 8 | 16 |
|-----------|-------|--------|--------|--------|--------|
|-----------|-------|--------|--------|--------|--------|
| OpenBLAS | 3.3
5 | 3.19 | 3.09 | 2.55 | 1.96
|
| OpenBLAS | 3.3
1 | 6.72 | 11.59 | 13.17 | 9.27
|
| MKLML | 6.33 | 12.02 | 22.88 | 40.53 | 63.09 |
| MKLML | 6.33 | 12.02 | 22.88 | 40.53 | 63.09 |
| MKL-DNN | 107.83| 148.84 | 177.78 | 189.35 | 217.69 |
| MKL-DNN | 107.83| 148.84 | 177.78 | 189.35 | 217.69 |
...
@@ -89,15 +89,15 @@ Test on batch size 1, 2, 4, 8, 16 on Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
...
@@ -89,15 +89,15 @@ Test on batch size 1, 2, 4, 8, 16 on Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
| BatchSize | 1 | 2 | 4 | 8 | 16 |
| BatchSize | 1 | 2 | 4 | 8 | 16 |
|-----------|--------|--------|--------|--------|--------|
|-----------|--------|--------|--------|--------|--------|
| OpenBLAS | 12.0
4 | 11.31 | 10.00 | 9.07 | 4.34
|
| OpenBLAS | 12.0
6 | 23.56 | 34.48 | 36.45 | 23.12
|
| MKLML | 22.74 | 41.56 | 81.22 | 133.47 | 210.53 |
| MKLML | 22.74 | 41.56 | 81.22 | 133.47 | 210.53 |
| MKL-DNN | 175.10 | 272.92 | 450.70 | 512.00 | 600.94 |
| MKL-DNN | 175.10 | 272.92 | 450.70 | 512.00 | 600.94 |
-
Alex
n
et
-
Alex
N
et
| BatchSize | 1 | 2 | 4 | 8 | 16 |
| BatchSize | 1 | 2 | 4 | 8 | 16 |
|-----------|--------|--------|--------|--------|--------|
|-----------|--------|--------|--------|--------|--------|
| OpenBLAS |
| | | |
|
| OpenBLAS |
3.53 | 6.23 | 15.04 | 26.06 | 31.62
|
| MKLML | 21.32 | 36.55 | 73.06 | 131.15 | 192.77 |
| MKLML | 21.32 | 36.55 | 73.06 | 131.15 | 192.77 |
| MKL-DNN | 442.91 | 656.41 | 719.10 | 847.68 | 850.51 |
| MKL-DNN | 442.91 | 656.41 | 719.10 | 847.68 | 850.51 |
...
...
benchmark/paddle/image/run_openblas_infer.sh
浏览文件 @
24920c32
...
@@ -8,6 +8,7 @@ function clock_to_seconds() {
...
@@ -8,6 +8,7 @@ function clock_to_seconds() {
}
}
function
infer
()
{
function
infer
()
{
export
OPENBLAS_MAIN_FREE
=
1
topology
=
$1
topology
=
$1
layer_num
=
$2
layer_num
=
$2
bs
=
$3
bs
=
$3
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录