Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
3228fb75
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
404
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
3228fb75
编写于
3月 17, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(cuda): conv algo heuristic choose
GitOrigin-RevId: 95c5e7d627ec8a57a8bf9572e4254947149ea6c6
上级
8c415f4e
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
6 addition
and
6 deletion
+6
-6
dnn/src/cuda/conv_bias/opr_impl.cpp
dnn/src/cuda/conv_bias/opr_impl.cpp
+3
-3
dnn/src/cuda/convolution/opr_impl.cpp
dnn/src/cuda/convolution/opr_impl.cpp
+3
-3
未找到文件。
dnn/src/cuda/conv_bias/opr_impl.cpp
浏览文件 @
3228fb75
...
...
@@ -148,9 +148,9 @@ ConvBiasForward::Algorithm* ConvBiasForwardImpl::get_algorithm_heuristic(
//! choose for large kernel cases
size_t
fh
=
args
.
filter_meta
.
spatial
[
0
],
fw
=
args
.
filter_meta
.
spatial
[
1
];
size_t
hi
=
src
[
2
],
wi
=
src
[
3
];
const
bool
prefer_dnn_lk_implbmm
=
hi
<=
2
*
fh
&&
wi
<=
2
*
fw
&&
wi
<
32
&&
hi
<=
32
;
const
bool
prefer_direct_lk
=
fh
>
10
&&
fw
>
10
;
const
bool
prefer_dnn_lk_implbmm
=
hi
<=
2
*
fh
&&
wi
<=
2
*
fw
;
//! filter size > 9, choose large kernel cases
const
bool
prefer_direct_lk
=
fh
>
9
&&
fw
>
9
;
//! avoid bad case in cudnn, check dnn chanwise impl first
if
(
is_chanwise
)
{
if
(
prefer_dnn_lk_implbmm
)
{
...
...
dnn/src/cuda/convolution/opr_impl.cpp
浏览文件 @
3228fb75
...
...
@@ -119,10 +119,10 @@ ConvolutionBackwardDataImpl::Algorithm* ConvolutionBackwardDataImpl::
size_t
fh
=
args
.
filter_meta
.
spatial
[
0
],
fw
=
args
.
filter_meta
.
spatial
[
1
];
size_t
ho
=
diff
[
2
],
wo
=
diff
[
3
];
const
bool
prefer_dnn_lk_implbmm
=
args
.
filter_meta
.
format
==
Param
::
Format
::
NCHW
&&
ho
<=
2
*
fh
&&
wo
<=
2
*
fw
&&
ho
<
32
&&
wo
<
32
;
ho
<=
2
*
fh
&&
wo
<=
2
*
fw
;
//! filter size > 9, choose large kernel cases
const
bool
prefer_direct_lk
=
args
.
filter_meta
.
format
==
Param
::
Format
::
NCHW
&&
fh
>
10
&&
fw
>
10
;
args
.
filter_meta
.
format
==
Param
::
Format
::
NCHW
&&
fh
>
9
&&
fw
>
9
;
if
(
prefer_dnn_lk_implbmm
)
{
#if CUDA_VERSION >= 10020
if
(
sm_algo_pack
.
implbmm_nchw_hmma
[
0
].
is_available_attribute
(
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录