Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
e8a16929
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
403
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
e8a16929
编写于
2月 11, 2022
作者:
M
Megvii Engine Team
提交者:
王彪
2月 27, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
feat(dnn/cuda): add heuristic rule for implicit batched gemm large kernel dwconv2d kernels
GitOrigin-RevId: 2d2c213bfdf91e85b2513cafb1dda0f6940199e5
上级
38067472
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
25 addition
and
1 deletion
+25
-1
dnn/src/cuda/conv_bias/opr_impl.cpp
dnn/src/cuda/conv_bias/opr_impl.cpp
+12
-1
dnn/src/cuda/convolution/opr_impl.cpp
dnn/src/cuda/convolution/opr_impl.cpp
+13
-0
未找到文件。
dnn/src/cuda/conv_bias/opr_impl.cpp
浏览文件 @
e8a16929
...
@@ -145,9 +145,20 @@ ConvBiasForward::Algorithm* ConvBiasForwardImpl::get_algorithm_heuristic(
...
@@ -145,9 +145,20 @@ ConvBiasForward::Algorithm* ConvBiasForwardImpl::get_algorithm_heuristic(
const
bool
prefer_dnn_chanwise
=
slow_cudnn_chanwise_impl
||
const
bool
prefer_dnn_chanwise
=
slow_cudnn_chanwise_impl
||
args
.
filter_meta
.
stride
[
0
]
!=
1
||
args
.
filter_meta
.
stride
[
0
]
!=
1
||
args
.
filter_meta
.
stride
[
1
]
!=
1
||
hw_size
<
512
;
args
.
filter_meta
.
stride
[
1
]
!=
1
||
hw_size
<
512
;
//! choose for large kernel cases
size_t
fh
=
args
.
filter_meta
.
spatial
[
2
],
fw
=
args
.
filter_meta
.
spatial
[
3
];
size_t
hi
=
src
[
2
],
wi
=
src
[
3
];
const
bool
prefer_dnn_lk_implbmm
=
hi
<=
2
*
fh
&&
wi
<=
2
*
fw
;
//! avoid bad case in cudnn, check dnn chanwise impl first
//! avoid bad case in cudnn, check dnn chanwise impl first
if
(
is_chanwise
)
{
if
(
is_chanwise
)
{
if
(
prefer_dnn_chanwise
)
{
if
(
prefer_dnn_lk_implbmm
)
{
if
(
sm_algo_pack
.
f16_implicit_bmm
[
0
].
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
return
&
sm_algo_pack
.
f16_implicit_bmm
[
0
];
if
(
sm_algo_pack
.
f32_implicit_bmm
[
0
].
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
return
&
sm_algo_pack
.
f32_implicit_bmm
[
0
];
}
else
if
(
prefer_dnn_chanwise
)
{
if
(
sm_algo_pack
.
chanwise
.
is_available_attribute
(
if
(
sm_algo_pack
.
chanwise
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
return
&
sm_algo_pack
.
chanwise
;
return
&
sm_algo_pack
.
chanwise
;
...
...
dnn/src/cuda/convolution/opr_impl.cpp
浏览文件 @
e8a16929
...
@@ -115,6 +115,19 @@ ConvolutionBackwardDataImpl::Algorithm* ConvolutionBackwardDataImpl::
...
@@ -115,6 +115,19 @@ ConvolutionBackwardDataImpl::Algorithm* ConvolutionBackwardDataImpl::
const
AlgoAttribute
&
negative_attr
)
{
const
AlgoAttribute
&
negative_attr
)
{
AlgoBase
::
SizeArgs
args
(
this
,
filter
,
diff
,
grad
);
AlgoBase
::
SizeArgs
args
(
this
,
filter
,
diff
,
grad
);
//! choose for large kernel cases
size_t
fh
=
args
.
filter_meta
.
spatial
[
2
],
fw
=
args
.
filter_meta
.
spatial
[
3
];
size_t
ho
=
diff
[
2
],
wo
=
diff
[
3
];
const
bool
prefer_dnn_lk_implbmm
=
args
.
filter_meta
.
format
==
Param
::
Format
::
NCHW
&&
ho
<=
2
*
fh
&&
wo
<=
2
*
fw
;
if
(
prefer_dnn_lk_implbmm
)
{
if
(
sm_algo_pack
.
implbmm_nchw_hmma
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
return
&
sm_algo_pack
.
implbmm_nchw_hmma
[
0
];
if
(
sm_algo_pack
.
implbmm_nchw_fma
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
return
&
sm_algo_pack
.
implbmm_nchw_fma
[
0
];
}
if
(
args
.
filter_meta
.
group
>
1
&&
if
(
args
.
filter_meta
.
group
>
1
&&
sm_algo_pack
.
chanwise
.
is_available_attribute
(
sm_algo_pack
.
chanwise
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
{
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
{
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录