Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
15d3b3b9
MegEngine
项目概览
MegEngine 天元
/
MegEngine
9 个月 前同步成功
通知
392
Star
4702
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
15d3b3b9
编写于
3月 22, 2021
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(mgb): fix mgb still profiling matmul even when no-profiling-on-shape-change
GitOrigin-RevId: d24f73193eaf3a428e466c10e79b29e3fc1e71d6
上级
31e4bf2c
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
54 addition
and
1 deletion
+54
-1
src/opr/impl/search_policy/algo_chooser.cpp
src/opr/impl/search_policy/algo_chooser.cpp
+8
-1
src/opr/include/megbrain/opr/search_policy/profiler.h
src/opr/include/megbrain/opr/search_policy/profiler.h
+7
-0
src/opr/test/blas.cpp
src/opr/test/blas.cpp
+39
-0
未找到文件。
src/opr/impl/search_policy/algo_chooser.cpp
浏览文件 @
15d3b3b9
...
...
@@ -384,8 +384,15 @@ AlgoChooser<Opr>::choose_by_profile(ExeContext& ctx,
MIDOUT_B
(
Opr
,
midout_iv
(
MGB_HASH_STR
(
"AlgoChooser::choose_by_profile"
)))
if
(
ctx
.
owner_graph
()
->
options
().
no_profiling_on_shape_change
)
{
auto
policy
=
ctx
.
megdnn_opr
()
->
execution_policy
();
if
(
policy
.
algo
.
valid
())
if
(
policy
.
algo
.
valid
())
{
return
policy
;
}
if
(
!
algo_usable_on_shape_change
<
Opr
>
())
{
mgb_log_warn
(
"choose algo by heuristic, which may cause performance "
"regression."
);
return
ctx
.
choose_by_heuristic
(
selected_strategy
);
}
}
if
(
enable_update
)
{
...
...
src/opr/include/megbrain/opr/search_policy/profiler.h
浏览文件 @
15d3b3b9
...
...
@@ -89,6 +89,13 @@ constexpr bool opr_contain_bias() {
return
std
::
is_same
<
Opr
,
megdnn
::
ConvBias
>::
value
;
}
//! matmul and batchedMatrixMul may not be usable once shape changed
template
<
typename
Opr
>
constexpr
bool
algo_usable_on_shape_change
()
{
return
!
(
std
::
is_same
<
Opr
,
megdnn
::
MatrixMul
>::
value
||
std
::
is_same
<
Opr
,
megdnn
::
BatchedMatrixMul
>::
value
);
}
template
<
typename
Opr
,
bool
has_prep
>
struct
PreprocessFilterImpl
{
using
T
=
union
{};
...
...
src/opr/test/blas.cpp
浏览文件 @
15d3b3b9
...
...
@@ -885,5 +885,44 @@ TEST(TestOprBlas, SingularValueDecompositionZeroGrad) {
run_svd_empty_grad_test
<
1
,
1
,
1
>
();
}
#if MGB_ENABLE_FASTRUN
TEST
(
TestOprBlas
,
MatrixMulExePolicy
)
{
using
Param
=
opr
::
MatrixMul
::
Param
;
Param
param
;
using
Policy
=
opr
::
MatrixMul
::
ExecutionPolicy
;
using
S
=
Policy
::
Strategy
;
Policy
policy
;
policy
.
strategy
=
S
::
PROFILE
;
auto
cn
=
CompNode
::
load
(
"cpux"
);
int
nr_get
=
0
;
auto
on_get
=
[
&
nr_get
](
const
std
::
string
&
,
const
void
*
,
size_t
,
const
void
*
,
size_t
)
{
++
nr_get
;
};
PersistentCacheHook
cache_hook
{
on_get
};
auto
graph
=
ComputingGraph
::
make
();
HostTensorGenerator
<>
gen
;
auto
mkvar
=
[
&
](
const
char
*
name
,
const
TensorShape
&
shp
)
{
return
opr
::
Host2DeviceCopy
::
make
(
*
graph
,
gen
(
shp
),
cn
).
rename
(
name
);
};
auto
a
=
mkvar
(
"a"
,
{
20
,
50
});
auto
b
=
mkvar
(
"b"
,
{
50
,
40
});
auto
matmul
=
opr
::
MatrixMul
::
make
(
a
,
b
,
param
,
policy
,
{});
HostTensorND
host_y
;
graph
->
options
().
no_profiling_on_shape_change
=
true
;
auto
func
=
graph
->
compile
({
make_callback_copy
(
matmul
,
host_y
)});
func
->
execute
();
ASSERT_EQ
(
nr_get
,
0
);
graph
->
options
().
no_profiling_on_shape_change
=
false
;
func
=
graph
->
compile
({
make_callback_copy
(
matmul
,
host_y
)});
func
->
execute
();
ASSERT_GT
(
nr_get
,
0
);
}
#endif
// vim: syntax=cpp.doxygen foldmethod=marker foldmarker=f{{{,f}}}
//
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录