Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
5a355138
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
404
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
5a355138
编写于
6月 14, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(mgb): fix profile skip condition
GitOrigin-RevId: f196eabc9810b5ac32744a10a1473a6b445f7f4a
上级
5bdc430e
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
21 addition
and
1 deletion
+21
-1
imperative/src/impl/transformations/dtype_promote.cpp
imperative/src/impl/transformations/dtype_promote.cpp
+18
-0
src/rdnn/impl/algo_chooser.cpp
src/rdnn/impl/algo_chooser.cpp
+3
-1
未找到文件。
imperative/src/impl/transformations/dtype_promote.cpp
浏览文件 @
5a355138
...
...
@@ -186,6 +186,15 @@ ValueRefList convolution_rule(const OpDef& op, Span<ValueRef> inputs) {
ValueRefList
matmul_rule
(
const
OpDef
&
op
,
Span
<
ValueRef
>
inputs
)
{
auto
&&
conv_op
=
const_cast
<
MatrixMul
&>
(
op
.
cast_final_safe
<
MatrixMul
>
());
SmallVector
<
DType
>
dtypes
=
get_value_dtypes
(
inputs
);
// skip dtype promotion when inputs are quantized
if
(
dtypes
[
0
].
category
()
==
megdnn
::
DTypeCategory
::
QUANTIZED
)
{
mgb_assert
(
dtypes
[
0
].
category
()
==
dtypes
[
1
].
category
(),
"inputs of matmul should have same quantized dtype."
);
return
imperative
::
apply
(
op
,
inputs
);
}
mgb
::
DType
target_dtype
;
if
(
DTypePromoteCfg
::
amp_dtype_autocast_enabled
)
{
...
...
@@ -212,6 +221,15 @@ ValueRefList batch_matmul_rule(const OpDef& op, Span<ValueRef> inputs) {
auto
&&
conv_op
=
const_cast
<
BatchedMatrixMul
&>
(
op
.
cast_final_safe
<
BatchedMatrixMul
>
());
SmallVector
<
DType
>
dtypes
=
get_value_dtypes
(
inputs
);
// skip dtype promotion when inputs are quantized
if
(
dtypes
[
0
].
category
()
==
megdnn
::
DTypeCategory
::
QUANTIZED
)
{
mgb_assert
(
dtypes
[
0
].
category
()
==
dtypes
[
1
].
category
(),
"inputs of batched matmul should have same quantized dtype."
);
return
imperative
::
apply
(
op
,
inputs
);
}
mgb
::
DType
target_dtype
;
if
(
DTypePromoteCfg
::
amp_dtype_autocast_enabled
)
{
...
...
src/rdnn/impl/algo_chooser.cpp
浏览文件 @
5a355138
...
...
@@ -600,7 +600,9 @@ typename AlgoChooser<Opr>::ImplExecutionPolicy AlgoChooser<Opr>::AlgoChooserHelp
auto
&&
megdnn_opr
=
opr
::
intl
::
create_megdnn_opr
<
_Opr
>
(
m_cn
);
// skip different sub opr, for example:
// skip matmul algo when profiling convolution
if
(
m_dnn_opr
->
get_opr_type
()
!=
megdnn_opr
->
get_opr_type
())
if
((
m_cn
.
device_type
()
==
mgb
::
CompNode
::
DeviceType
::
CUDA
||
m_cn
.
device_type
()
==
mgb
::
CompNode
::
DeviceType
::
ROCM
)
&&
m_dnn_opr
->
get_opr_type
()
!=
megdnn_opr
->
get_opr_type
())
continue
;
megdnn_opr
->
param
()
=
Algorithm
::
deserialize_read_pod
<
typename
_Opr
::
Param
>
(
_item
.
param
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录