Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
a7e28ebe
MegEngine
项目概览
MegEngine 天元
/
MegEngine
接近 2 年 前同步成功
通知
414
Star
4708
Fork
583
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
a7e28ebe
编写于
9月 19, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(dnn): fix winograd load error and cpuinfo test error
GitOrigin-RevId: 32c9ee58d1cffe1a6668b0c5871b026e128761af
上级
41b9db85
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
7 addition
and
3 deletion
+7
-3
dnn/src/arm_common/conv_bias/int8/strategy_2x3_8x8.cpp
dnn/src/arm_common/conv_bias/int8/strategy_2x3_8x8.cpp
+5
-1
dnn/test/arm_common/cpuinfo.cpp
dnn/test/arm_common/cpuinfo.cpp
+2
-2
未找到文件。
dnn/src/arm_common/conv_bias/int8/strategy_2x3_8x8.cpp
浏览文件 @
a7e28ebe
...
@@ -339,6 +339,9 @@ void winograd_2x3_8x8_s8::input(
...
@@ -339,6 +339,9 @@ void winograd_2x3_8x8_s8::input(
size_t
nr_units_in_tile
)
{
size_t
nr_units_in_tile
)
{
megdnn_assert
(
IC
%
8
==
0
);
megdnn_assert
(
IC
%
8
==
0
);
constexpr
int
alpha
=
3
+
2
-
1
;
constexpr
int
alpha
=
3
+
2
-
1
;
constexpr
int
SIMD_WIDTH
=
4
;
//! the input is load with int8 this is used to keep the borad load valid
constexpr
int
board_security_width
=
std
::
max
(
2
*
SIMD_WIDTH
,
alpha
);
// OW = IW + 2 * PW - KERNEL_SIZE + 1
// OW = IW + 2 * PW - KERNEL_SIZE + 1
auto
units_w
=
div_ceil
<
size_t
>
(
IW
+
2
*
PW
-
KERNEL_SIZE
+
1
,
OUTPUT_BLOCK_SIZE
);
auto
units_w
=
div_ceil
<
size_t
>
(
IW
+
2
*
PW
-
KERNEL_SIZE
+
1
,
OUTPUT_BLOCK_SIZE
);
...
@@ -353,7 +356,8 @@ void winograd_2x3_8x8_s8::input(
...
@@ -353,7 +356,8 @@ void winograd_2x3_8x8_s8::input(
int
ih_start
=
nh
*
OUTPUT_BLOCK_SIZE
-
PH
;
int
ih_start
=
nh
*
OUTPUT_BLOCK_SIZE
-
PH
;
int
iw_start
=
nw
*
OUTPUT_BLOCK_SIZE
-
PW
;
int
iw_start
=
nw
*
OUTPUT_BLOCK_SIZE
-
PW
;
if
(
ih_start
>=
0
&&
ih_start
+
alpha
<=
static_cast
<
int
>
(
IH
)
&&
if
(
ih_start
>=
0
&&
ih_start
+
alpha
<=
static_cast
<
int
>
(
IH
)
&&
iw_start
>=
0
&&
iw_start
+
alpha
<=
static_cast
<
int
>
(
IW
))
{
iw_start
>=
0
&&
iw_start
+
board_security_width
<=
static_cast
<
int
>
(
IW
))
{
InputTransform2X3_qs8
::
prepare
<
true
>
(
InputTransform2X3_qs8
::
prepare
<
true
>
(
input
,
patch
,
patchT
,
ih_start
,
iw_start
,
IH
,
IW
,
ic
,
IC
);
input
,
patch
,
patchT
,
ih_start
,
iw_start
,
IH
,
IW
,
ic
,
IC
);
InputTransform2X3_qs8
::
transform
(
InputTransform2X3_qs8
::
transform
(
...
...
dnn/test/arm_common/cpuinfo.cpp
浏览文件 @
a7e28ebe
...
@@ -202,9 +202,9 @@ TEST(ARM_RUNTIME, CPUINFO_SDM8GEN1) {
...
@@ -202,9 +202,9 @@ TEST(ARM_RUNTIME, CPUINFO_SDM8GEN1) {
ASSERT_TRUE
(
cpuinfo_has_arm_neon_dot
());
ASSERT_TRUE
(
cpuinfo_has_arm_neon_dot
());
ASSERT_FALSE
(
cpuinfo_has_arm_sve2
());
ASSERT_FALSE
(
cpuinfo_has_arm_sve2
());
#if MEGDNN_AARCH64
ASSERT_TRUE
(
cpuinfo_has_arm_i8mm
());
ASSERT_TRUE
(
cpuinfo_has_arm_i8mm
());
#endif
for
(
uint32_t
i
=
0
;
i
<
cpuinfo_get_processors_count
();
i
++
)
{
for
(
uint32_t
i
=
0
;
i
<
cpuinfo_get_processors_count
();
i
++
)
{
ASSERT_EQ
(
cpuinfo_get_core
(
i
),
cpuinfo_get_processor
(
i
)
->
core
);
ASSERT_EQ
(
cpuinfo_get_core
(
i
),
cpuinfo_get_processor
(
i
)
->
core
);
}
}
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录