Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Xiaomi
Mace
提交
24fade6d
Mace
项目概览
Xiaomi
/
Mace
通知
106
Star
40
Fork
27
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
Mace
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
24fade6d
编写于
5月 30, 2018
作者:
李
李寅
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Optimize gemm x84
上级
4aa83602
变更
3
展开全部
隐藏空白更改
内联
并排
Showing
3 changed file
with
851 addition
and
506 deletion
+851
-506
mace/kernels/gemm.cc
mace/kernels/gemm.cc
+789
-481
mace/kernels/gemm.h
mace/kernels/gemm.h
+1
-0
mace/kernels/gemm_test.cc
mace/kernels/gemm_test.cc
+61
-25
未找到文件。
mace/kernels/gemm.cc
浏览文件 @
24fade6d
此差异已折叠。
点击以展开。
mace/kernels/gemm.h
浏览文件 @
24fade6d
...
...
@@ -34,6 +34,7 @@ void Gemm(const float *A,
void
GemmRef
(
const
float
*
A
,
const
float
*
B
,
const
index_t
batch
,
const
index_t
height
,
const
index_t
K
,
const
index_t
width
,
...
...
mace/kernels/gemm_test.cc
浏览文件 @
24fade6d
...
...
@@ -21,62 +21,98 @@
namespace
mace
{
TEST
(
GEMMTest
,
gemm
)
{
index_t
N
=
17
;
index_t
M
=
33
;
index_t
K
=
64
;
std
::
unique_ptr
<
float
[]
>
A
(
new
float
[
N
*
K
]);
std
::
unique_ptr
<
float
[]
>
B
(
new
float
[
K
*
M
]);
std
::
unique_ptr
<
float
[]
>
C
(
new
float
[
N
*
M
]);
std
::
unique_ptr
<
float
[]
>
C_ref
(
new
float
[
N
*
M
]);
namespace
{
void
GemmTest
(
index_t
batch
,
index_t
N
,
index_t
K
,
index_t
M
)
{
std
::
unique_ptr
<
float
[]
>
A
(
new
float
[
batch
*
N
*
K
]);
std
::
unique_ptr
<
float
[]
>
B
(
new
float
[
batch
*
K
*
M
]);
std
::
unique_ptr
<
float
[]
>
C
(
new
float
[
batch
*
N
*
M
]);
std
::
unique_ptr
<
float
[]
>
C_ref
(
new
float
[
batch
*
N
*
M
]);
std
::
random_device
rd
;
std
::
mt19937
gen
(
rd
());
std
::
normal_distribution
<
float
>
nd
(
0
,
1
);
std
::
generate
(
A
.
get
(),
A
.
get
()
+
N
*
K
,
std
::
generate
(
A
.
get
(),
A
.
get
()
+
batch
*
N
*
K
,
[
&
gen
,
&
nd
]
{
return
nd
(
gen
);
});
std
::
generate
(
B
.
get
(),
B
.
get
()
+
K
*
M
,
std
::
generate
(
B
.
get
(),
B
.
get
()
+
batch
*
K
*
M
,
[
&
gen
,
&
nd
]
{
return
nd
(
gen
);
});
kernels
::
Gemm
(
A
.
get
(),
B
.
get
(),
1
,
N
,
K
,
M
,
C
.
get
());
kernels
::
GemmRef
(
A
.
get
(),
B
.
get
(),
N
,
K
,
M
,
C_ref
.
get
());
kernels
::
Gemm
(
A
.
get
(),
B
.
get
(),
batch
,
N
,
K
,
M
,
C
.
get
());
kernels
::
GemmRef
(
A
.
get
(),
B
.
get
(),
batch
,
N
,
K
,
M
,
C_ref
.
get
());
for
(
int
i
=
0
;
i
<
N
*
M
;
++
i
)
{
for
(
int
i
=
0
;
i
<
batch
*
N
*
M
;
++
i
)
{
EXPECT_NEAR
(
C_ref
[
i
],
C
[
i
],
0.1
);
}
}
TEST
(
GEMMTest
,
gemv
)
{
index_t
N
=
17
;
index_t
K
=
63
;
std
::
unique_ptr
<
float
[]
>
A
(
new
float
[
N
*
K
]);
std
::
unique_ptr
<
float
[]
>
B
(
new
float
[
K
]);
std
::
unique_ptr
<
float
[]
>
C
(
new
float
[
N
]);
std
::
unique_ptr
<
float
[]
>
C_ref
(
new
float
[
N
]);
void
GemvTest
(
index_t
batch
,
index_t
N
,
index_t
M
)
{
std
::
unique_ptr
<
float
[]
>
A
(
new
float
[
N
*
M
]);
std
::
unique_ptr
<
float
[]
>
B
(
new
float
[
batch
*
M
]);
std
::
unique_ptr
<
float
[]
>
C
(
new
float
[
batch
*
N
]);
std
::
unique_ptr
<
float
[]
>
C_ref
(
new
float
[
batch
*
N
]);
std
::
random_device
rd
;
std
::
mt19937
gen
(
rd
());
std
::
normal_distribution
<
float
>
nd
(
0
,
1
);
std
::
generate
(
A
.
get
(),
A
.
get
()
+
N
*
K
,
std
::
generate
(
A
.
get
(),
A
.
get
()
+
N
*
M
,
[
&
gen
,
&
nd
]
{
return
nd
(
gen
);
});
std
::
generate
(
B
.
get
(),
B
.
get
()
+
K
,
std
::
generate
(
B
.
get
(),
B
.
get
()
+
batch
*
M
,
[
&
gen
,
&
nd
]
{
return
nd
(
gen
);
});
kernels
::
Gemv
(
A
.
get
(),
B
.
get
(),
1
,
K
,
N
,
C
.
get
());
kernels
::
GemvRef
(
A
.
get
(),
B
.
get
(),
1
,
K
,
N
,
C_ref
.
get
());
kernels
::
Gemv
(
A
.
get
(),
B
.
get
(),
batch
,
M
,
N
,
C
.
get
());
kernels
::
GemvRef
(
A
.
get
(),
B
.
get
(),
batch
,
M
,
N
,
C_ref
.
get
());
for
(
int
i
=
0
;
i
<
N
;
++
i
)
{
for
(
int
i
=
0
;
i
<
batch
*
N
;
++
i
)
{
EXPECT_NEAR
(
C_ref
[
i
],
C
[
i
],
0.1
);
}
}
}
// namespace
TEST
(
GEMMTest
,
AlignedWithoutBatch
)
{
GemmTest
(
1
,
1
,
64
,
128
);
GemmTest
(
1
,
2
,
64
,
128
);
GemmTest
(
1
,
3
,
64
,
128
);
GemmTest
(
1
,
4
,
64
,
128
);
GemmTest
(
1
,
5
,
64
,
128
);
GemmTest
(
1
,
6
,
64
,
128
);
GemmTest
(
1
,
7
,
64
,
128
);
GemmTest
(
1
,
17
,
64
,
128
);
}
TEST
(
GEMMTest
,
UnalignedWithoutBatch
)
{
GemmTest
(
1
,
1
,
63
,
127
);
GemmTest
(
1
,
2
,
63
,
127
);
GemmTest
(
1
,
3
,
63
,
127
);
GemmTest
(
1
,
4
,
63
,
127
);
GemmTest
(
1
,
5
,
63
,
127
);
GemmTest
(
1
,
6
,
63
,
127
);
GemmTest
(
1
,
7
,
63
,
127
);
GemmTest
(
1
,
17
,
63
,
127
);
}
TEST
(
GEMMTest
,
UnalignedWithBatch
)
{
GemmTest
(
3
,
1
,
63
,
127
);
GemmTest
(
3
,
2
,
63
,
127
);
GemmTest
(
3
,
3
,
63
,
127
);
GemmTest
(
3
,
4
,
63
,
127
);
GemmTest
(
3
,
5
,
63
,
127
);
GemmTest
(
3
,
6
,
63
,
127
);
GemmTest
(
3
,
7
,
63
,
127
);
GemmTest
(
3
,
17
,
63
,
127
);
}
TEST
(
GEMMTest
,
gemv
)
{
GemvTest
(
1
,
17
,
63
);
GemvTest
(
3
,
17
,
63
);
}
}
// namespace mace
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录