Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
711b5bf5
MegEngine
项目概览
MegEngine 天元
/
MegEngine
11 个月 前同步成功
通知
392
Star
4702
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
711b5bf5
编写于
5月 17, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(dnn/arm_common): fix some load beyond memory
GitOrigin-RevId: acd63639455a75fa6d6f98337d5090a1e2d9b318
上级
3ebb8db0
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
11 addition
and
5 deletion
+11
-5
dnn/src/arm_common/conv_bias/int8/direct.cpp
dnn/src/arm_common/conv_bias/int8/direct.cpp
+4
-2
dnn/src/arm_common/conv_bias/int8/direct_dotprod.cpp
dnn/src/arm_common/conv_bias/int8/direct_dotprod.cpp
+4
-2
dnn/src/arm_common/convolution/int8x8x32/conv_backdata_stride1.cpp
...rm_common/convolution/int8x8x32/conv_backdata_stride1.cpp
+3
-1
未找到文件。
dnn/src/arm_common/conv_bias/int8/direct.cpp
浏览文件 @
711b5bf5
...
...
@@ -389,7 +389,8 @@ void conv_bias::conv_direct_stride1_3x3_int8_nchw(
ACC_S16_S32
(
sum10
,
sum11
,
d1
);
int8x8_t
_r30
=
vld1_s8
(
sptr
+
3
*
IW
);
int8x8_t
_r3n
=
vld1_s8
(
sptr
+
3
*
IW
+
8
);
int8x8_t
_r3n
=
vreinterpret_s8_s16
(
vld1_dup_s16
((
int16_t
*
)(
sptr
+
3
*
IW
+
8
)));
int8x8_t
_r31
=
vext_s8
(
_r30
,
_r3n
,
1
);
int8x8_t
_r32
=
vext_s8
(
_r30
,
_r3n
,
2
);
d1
=
vmull_s8
(
_r30
,
k20
);
...
...
@@ -444,7 +445,8 @@ void conv_bias::conv_direct_stride1_3x3_int8_nchw(
ACC_S16_S32
(
sum00
,
sum01
,
d0
);
int8x8_t
_r20
=
vld1_s8
(
sptr
+
2
*
IW
);
int8x8_t
_r2n
=
vld1_s8
(
sptr
+
2
*
IW
+
8
);
int8x8_t
_r2n
=
vreinterpret_s8_s16
(
vld1_dup_s16
((
int16_t
*
)(
sptr
+
2
*
IW
+
8
)));
int8x8_t
_r21
=
vext_s8
(
_r20
,
_r2n
,
1
);
int8x8_t
_r22
=
vext_s8
(
_r20
,
_r2n
,
2
);
d0
=
vmull_s8
(
_r20
,
k20
);
...
...
dnn/src/arm_common/conv_bias/int8/direct_dotprod.cpp
浏览文件 @
711b5bf5
...
...
@@ -437,8 +437,10 @@ void conv_bias::conv_direct_stride1_3x3_int8_dot(
_tmp
=
vtranslq_s8
(
vld1_s8
(
r2
));
CALC_2
(
678
,
345
,
0
);
_tmp
=
vtranslq_s8
(
vld1_s8
(
r3
));
int8x8_t
tmp_last
=
vreinterpret_s8_s32
(
vld1_dup_s32
(
r3
));
tmp_last
=
vreinterpret_s8_s16
(
vld1_lane_s16
(
r3
+
4
,
vreinterpret_s16_s8
(
tmp_last
),
2
));
_tmp
=
vtranslq_s8
(
tmp_last
);
CALC_1
(
678
,
0
);
POSTPROCESS_2X4
(
_sum00
,
_sum10
,
outptr
,
outptr2
,
dstptr
,
dstptr2
);
...
...
dnn/src/arm_common/convolution/int8x8x32/conv_backdata_stride1.cpp
浏览文件 @
711b5bf5
...
...
@@ -297,7 +297,9 @@ void deconv_direct_2x2(
_tmp
=
vtranslq_s8
(
vld1_s8
(
r0
));
CALC_0
(
1
,
0
);
_tmp
=
vtranslq_s8
(
vld1_s8
(
r1
));
int8x8_t
temp_x
=
vld1_dup_s32
(
r1
);
temp_x
=
vld1_lane_s8
(
r1
+
4
,
temp_x
,
4
);
_tmp
=
vtranslq_s8
(
temp_x
);
CALC_0
(
23
,
0
);
vst1q_s32
(
outptr
,
_sum00
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录