Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
b2f0ceb2
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
404
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
b2f0ceb2
编写于
5月 08, 2020
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
feat(dnn/naive): add convolution weight preprocess interface
GitOrigin-RevId: d0fd6c75a6c45922f18e734c134c5ddcb7bfa8d9
上级
9b908c02
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
49 addition
and
10 deletion
+49
-10
dnn/include/megdnn/oprs/nn.h
dnn/include/megdnn/oprs/nn.h
+49
-10
未找到文件。
dnn/include/megdnn/oprs/nn.h
浏览文件 @
b2f0ceb2
...
...
@@ -131,6 +131,13 @@ public:
}
};
struct
PreprocessedFilter
{
//! user data; its lifetime should be bound to MegDNN Convolution
//! operator
void
*
algorithm_id
;
TensorNDArray
tensors
;
};
protected:
// Check or deduce output DType
void
check_or_deduce_dtype_fwd
(
DType
src
,
DType
filter
,
DType
&
dst
)
const
;
...
...
@@ -200,13 +207,27 @@ public:
* \param[out] dst (n, oc, oh, ow)
*/
virtual
void
exec
(
_megdnn_tensor_in
src
,
_megdnn_tensor_in
filter
,
_megdnn_tensor_out
dst
,
_megdnn_workspace
workspace
)
=
0
;
_megdnn_tensor_out
dst
,
const
PreprocessedFilter
*
preprocessed_filter
,
_megdnn_workspace
workspace
)
=
0
;
virtual
void
exec_preprocess
(
const
TensorLayout
&
src_layout
,
_megdnn_tensor_in
filter
,
const
TensorLayout
&
dst_layout
,
PreprocessedFilter
*
preprocessed_filter
,
_megdnn_workspace
workspace
)
=
0
;
void
deduce_dtype
(
DType
src
,
DType
filter
,
DType
&
dst
);
void
deduce_layout
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
TensorLayout
&
dst
);
virtual
size_t
get_workspace_in_bytes
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
dst
)
=
0
;
virtual
size_t
get_workspace_in_bytes
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
dst
,
PreprocessedFilter
*
preprocessed_filter
)
=
0
;
virtual
SmallVector
<
TensorLayout
>
deduce_preprocessed_filter_layout
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
dst
)
=
0
;
virtual
size_t
get_preprocess_workspace_in_bytes
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
dst
)
=
0
;
protected:
CanonizedFilterMeta
check_exec
(
const
TensorLayout
&
src
,
...
...
@@ -297,17 +318,35 @@ public:
*/
virtual
void
exec
(
_megdnn_tensor_in
src
,
_megdnn_tensor_in
filter
,
_megdnn_tensor_in
bias
,
_megdnn_tensor_in
z
,
_megdnn_tensor_out
dst
,
_megdnn_workspace
workspace
)
=
0
;
_megdnn_tensor_out
dst
,
const
PreprocessedFilter
*
preprocessed_filter
,
_megdnn_workspace
workspace
)
=
0
;
virtual
void
exec_preprocess
(
const
TensorLayout
&
src_layout
,
_megdnn_tensor_in
filter
,
const
TensorLayout
&
bias_layout
,
const
TensorLayout
&
z_layout
,
const
TensorLayout
&
dst_layout
,
PreprocessedFilter
*
preprocessed_filter
,
_megdnn_workspace
workspace
)
=
0
;
void
deduce_dtype
(
DType
src
,
DType
filter
,
DType
bias
,
DType
z
,
DType
&
dst
);
void
deduce_layout
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
bias
,
const
TensorLayout
&
z
,
TensorLayout
&
dst
);
virtual
size_t
get_workspace_in_bytes
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
bias
,
const
TensorLayout
&
z
,
const
TensorLayout
&
dst
)
=
0
;
virtual
size_t
get_workspace_in_bytes
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
bias
,
const
TensorLayout
&
z
,
const
TensorLayout
&
dst
,
PreprocessedFilter
*
preprocessed_filter
)
=
0
;
virtual
size_t
get_preprocess_workspace_in_bytes
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
bias
,
const
TensorLayout
&
z
,
const
TensorLayout
&
dst
)
=
0
;
virtual
SmallVector
<
TensorLayout
>
deduce_preprocessed_filter_layout
(
const
TensorLayout
&
src
,
const
TensorLayout
&
filter
,
const
TensorLayout
&
bias
,
const
TensorLayout
&
z
,
const
TensorLayout
&
dst
)
=
0
;
enum
class
BiasMode
:
uint32_t
{
NO_BIAS
=
0
,
//!< no bias
BROADCAST_CHANNEL_BIAS
,
//!< broadcast channel bias, [1, c, 1, 1]
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录