Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
310c805f
MegEngine
项目概览
MegEngine 天元
/
MegEngine
大约 1 年 前同步成功
通知
399
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
310c805f
编写于
9月 07, 2020
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(dnn/cuda): use kernel parameter instead of user constant memory
GitOrigin-RevId: 6080b24cc850fcf28b29606967eb68338ff69a92
上级
165798bf
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
6 addition
and
10 deletion
+6
-10
dnn/test/cuda/conv_bias_int8.cpp
dnn/test/cuda/conv_bias_int8.cpp
+6
-10
未找到文件。
dnn/test/cuda/conv_bias_int8.cpp
浏览文件 @
310c805f
...
...
@@ -6,7 +6,8 @@
*
* Unless required by applicable law or agreed to in writing,
* software distributed under the License is distributed on an
* "AS IS" BASIS, WITHOUT ARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* "AS IS" BASIS, WITHOUT ARRANTIES OR CONDITIONS OF ANY KIND, either express or
* implied.
*/
#include "megdnn/oprs/nn.h"
...
...
@@ -37,7 +38,7 @@ std::vector<BenchArgs> get_resnet50_bench_args(size_t batch = 64) {
args
.
emplace_back
(
BenchArgs
{
batch
,
256
,
56
,
56
,
32
,
3
,
1
});
args
.
emplace_back
(
BenchArgs
{
batch
,
256
,
56
,
56
,
32
,
3
,
2
});
args
.
emplace_back
(
BenchArgs
{
batch
,
4
,
256
,
256
,
32
,
7
,
2
});
args
.
emplace_back
(
BenchArgs
{
batch
,
256
,
56
,
56
,
64
,
1
,
1
});
args
.
emplace_back
(
BenchArgs
{
batch
,
64
,
56
,
56
,
64
,
1
,
1
});
args
.
emplace_back
(
BenchArgs
{
batch
,
64
,
56
,
56
,
64
,
3
,
1
});
...
...
@@ -614,11 +615,8 @@ TEST_F(CUDA, CONV_BIAS_INT8_CHWN4_HSWISH) {
param
.
stride_h
=
param
.
stride_w
=
1
;
param
.
format
=
param
::
ConvBias
::
Format
::
CHWN4
;
param
.
nonlineMode
=
param
::
ConvBias
::
NonlineMode
::
H_SWISH
;
checker
.
set_param
(
param
).
execs
({{
4
,
12
,
12
,
32
,
4
},
{
4
,
3
,
3
,
16
,
4
},
{
4
,
1
,
1
,
1
,
4
},
{},
{}});
checker
.
set_param
(
param
).
execs
(
{{
4
,
12
,
12
,
32
,
4
},
{
4
,
3
,
3
,
16
,
4
},
{
4
,
1
,
1
,
1
,
4
},
{},
{}});
}
TEST_F
(
CUDA
,
CONV_BIAS_INT8_CHWN4_CHECK_BOUNDS
)
{
...
...
@@ -1076,7 +1074,6 @@ TEST_F(CUDA, CONV_BIAS_INT8_CHWN4_UNROLL_WIDTH_TENSORCORE_1x1_ALGO_2) {
}
#if CUDA_VERSION >= 10020
/// \note: we only check several cases and block sizes in megdnn_test, the full
/// testcases are written in cutlass repository
...
...
@@ -1234,8 +1231,7 @@ TEST_F(CUDA, BENCHMARK_CUTLASS_CONV_BIAS_INT8_NCHW4) {
handle_cuda
(),
get_resnet50_bench_args
(
64
),
dtype
::
QuantizedS8
{
1.2
f
},
dtype
::
QuantizedS8
{
1.3
f
},
dtype
::
QuantizedS32
{
1.2
f
*
1.3
f
},
dtype
::
QuantizedS8
{
1.0
f
},
"INT8_NCHW4_DOTPROD_IMPLICIT_GEMM"
,
param
::
ConvBias
::
Format
::
NCHW4
);
"INT8_NCHW4_DOTPROD_IMPLICIT_GEMM"
,
param
::
ConvBias
::
Format
::
NCHW4
);
}
#endif
}
// namespace test
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录