Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
00083d13
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
403
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
00083d13
编写于
5月 20, 2021
作者:
M
Megvii Engine Team
提交者:
huangxinda
7月 19, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(dnn/cuda): fix recursive algo search for fallback_nchw_qs8
GitOrigin-RevId: 6be2991224bced3a38a17b6b888fd4f324d03f9f
上级
bba04f02
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
34 addition
and
1 deletion
+34
-1
dnn/src/cuda/conv_bias/algo.h
dnn/src/cuda/conv_bias/algo.h
+4
-1
dnn/src/cuda/conv_bias/conv_nchwqs8.cpp
dnn/src/cuda/conv_bias/conv_nchwqs8.cpp
+30
-0
未找到文件。
dnn/src/cuda/conv_bias/algo.h
浏览文件 @
00083d13
...
...
@@ -575,7 +575,10 @@ public:
return
AlgoAttribute
::
REPRODUCIBLE
;
}
MEGDNN_DECL_ALGO_TYPE
(
CUDA_IMPLICIT_GEMM_NCHW4_DOTPROD_INT8
)
std
::
vector
<
SearchItem
>
get_subopr_list
(
const
TensorLayoutArray
&
layouts
,
const
OperatorBase
*
opr
)
const
override
;
private:
void
make_inner_layout
(
const
SizeArgs
&
args
,
TensorLayout
&
inner_src_layout
,
TensorLayout
&
inner_weight_layout
,
...
...
dnn/src/cuda/conv_bias/conv_nchwqs8.cpp
浏览文件 @
00083d13
...
...
@@ -69,6 +69,32 @@ void ConvBiasForwardImpl::AlgoFallbackNCHWQS8::make_inner_layout(
}
};
std
::
vector
<
Algorithm
::
SearchItem
>
ConvBiasForwardImpl
::
AlgoFallbackNCHWQS8
::
get_subopr_list
(
const
TensorLayoutArray
&
layouts
,
const
OperatorBase
*
opr
)
const
{
const
ConvBiasForwardImpl
*
o
=
static_cast
<
const
ConvBiasForwardImpl
*>
(
opr
);
SizeArgs
args
(
const_cast
<
ConvBiasForwardImpl
*>
(
o
),
layouts
[
0
],
layouts
[
1
],
layouts
[
2
],
layouts
[
3
],
layouts
[
4
],
nullptr
);
TensorLayout
inner_src_layout
;
TensorLayout
inner_weight_layout
;
TensorLayout
inner_dst_layout
;
TensorLayout
inner_bias_layout
;
TensorLayout
inner_z_layout
;
make_inner_layout
(
args
,
inner_src_layout
,
inner_weight_layout
,
inner_dst_layout
,
inner_bias_layout
,
inner_z_layout
);
Param
inner_conv_param
=
o
->
param
();
inner_conv_param
.
format
=
Param
::
Format
::
NCHW4
;
std
::
string
param_str
;
Algorithm
::
serialize_write_pod
(
inner_conv_param
,
param_str
);
return
{{
Algorithm
::
OprType
::
CONVBIAS_FORWARD
,
param_str
,
{
inner_src_layout
,
inner_weight_layout
,
inner_bias_layout
,
inner_z_layout
,
inner_dst_layout
}}};
}
bool
ConvBiasForwardImpl
::
AlgoFallbackNCHWQS8
::
is_available
(
const
SizeArgs
&
args
)
const
{
if
(
!
args
.
src_layout
->
is_contiguous
()
||
...
...
@@ -109,6 +135,8 @@ WorkspaceBundle ConvBiasForwardImpl::AlgoFallbackNCHWQS8::get_workspace_bundle(
}
auto
opr
=
args
.
handle
->
create_operator
<
ConvBiasForward
>
();
opr
->
param
()
=
inner_conv_param
;
set_execution_policy
<
ConvBiasForward
,
ConvBiasForward
*>
(
args
.
opr
,
opr
.
get
());
return
WorkspaceBundle
(
ptr
,
{
inner_src_layout
.
span
().
dist_byte
(),
...
...
@@ -164,6 +192,8 @@ void ConvBiasForwardImpl::AlgoFallbackNCHWQS8::exec(
inner_conv_param
.
format
=
dst_float
?
Param
::
Format
::
NCHW4_NCHW
:
Param
::
Format
::
NCHW4
;
auto
inner_opr
=
args
.
handle
->
create_operator
<
ConvBiasForward
>
();
set_execution_policy
<
ConvBiasForward
,
ConvBiasForward
*>
(
args
.
opr
,
inner_opr
.
get
());
inner_opr
->
param
()
=
inner_conv_param
;
relayout_nchw_nchw4
->
exec
(
*
args
.
src_tensor
,
inner_src
,
{});
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录