Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
f7994683
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
403
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
f7994683
编写于
3月 07, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
feat(cuda): add large kernel direct conv to heuristic algo chooser
GitOrigin-RevId: bc927b6df736ee807b816d1652d602742c591f8e
上级
6dc0c0b9
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
18 addition
and
2 deletion
+18
-2
dnn/src/cuda/conv_bias/opr_impl.cpp
dnn/src/cuda/conv_bias/opr_impl.cpp
+8
-1
dnn/src/cuda/convolution/opr_impl.cpp
dnn/src/cuda/convolution/opr_impl.cpp
+10
-1
未找到文件。
dnn/src/cuda/conv_bias/opr_impl.cpp
浏览文件 @
f7994683
...
...
@@ -148,7 +148,9 @@ ConvBiasForward::Algorithm* ConvBiasForwardImpl::get_algorithm_heuristic(
//! choose for large kernel cases
size_t
fh
=
args
.
filter_meta
.
spatial
[
0
],
fw
=
args
.
filter_meta
.
spatial
[
1
];
size_t
hi
=
src
[
2
],
wi
=
src
[
3
];
const
bool
prefer_dnn_lk_implbmm
=
hi
<=
2
*
fh
&&
wi
<=
2
*
fw
;
const
bool
prefer_dnn_lk_implbmm
=
hi
<=
2
*
fh
&&
wi
<=
2
*
fw
&&
wi
<
32
&&
hi
<=
32
;
const
bool
prefer_direct_lk
=
fh
>
10
&&
fw
>
10
;
//! avoid bad case in cudnn, check dnn chanwise impl first
if
(
is_chanwise
)
{
if
(
prefer_dnn_lk_implbmm
)
{
...
...
@@ -160,6 +162,11 @@ ConvBiasForward::Algorithm* ConvBiasForwardImpl::get_algorithm_heuristic(
if
(
sm_algo_pack
.
f32_implicit_bmm
[
0
].
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
return
&
sm_algo_pack
.
f32_implicit_bmm
[
0
];
}
else
if
(
prefer_direct_lk
&&
sm_algo_pack
.
depthwise_large_filter
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
{
return
&
sm_algo_pack
.
depthwise_large_filter
;
}
else
if
(
prefer_dnn_chanwise
)
{
if
(
sm_algo_pack
.
chanwise
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
...
...
dnn/src/cuda/convolution/opr_impl.cpp
浏览文件 @
f7994683
...
...
@@ -119,7 +119,10 @@ ConvolutionBackwardDataImpl::Algorithm* ConvolutionBackwardDataImpl::
size_t
fh
=
args
.
filter_meta
.
spatial
[
0
],
fw
=
args
.
filter_meta
.
spatial
[
1
];
size_t
ho
=
diff
[
2
],
wo
=
diff
[
3
];
const
bool
prefer_dnn_lk_implbmm
=
args
.
filter_meta
.
format
==
Param
::
Format
::
NCHW
&&
ho
<=
2
*
fh
&&
wo
<=
2
*
fw
;
ho
<=
2
*
fh
&&
wo
<=
2
*
fw
&&
ho
<
32
&&
wo
<
32
;
const
bool
prefer_direct_lk
=
args
.
filter_meta
.
format
==
Param
::
Format
::
NCHW
&&
fh
>
10
&&
fw
>
10
;
if
(
prefer_dnn_lk_implbmm
)
{
#if CUDA_VERSION >= 10020
if
(
sm_algo_pack
.
implbmm_nchw_hmma
[
0
].
is_available_attribute
(
...
...
@@ -131,6 +134,12 @@ ConvolutionBackwardDataImpl::Algorithm* ConvolutionBackwardDataImpl::
return
&
sm_algo_pack
.
implbmm_nchw_fma
[
0
];
}
if
(
prefer_direct_lk
&&
sm_algo_pack
.
depthwise_large_filter
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
{
return
&
sm_algo_pack
.
depthwise_large_filter
;
}
if
(
args
.
filter_meta
.
group
>
1
&&
sm_algo_pack
.
chanwise
.
is_available_attribute
(
args
,
positive_attr
,
negative_attr
,
workspace_limit_in_bytes
))
{
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录