Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
af6cdb20
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
404
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
af6cdb20
编写于
5月 07, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
feat(fallback): fix ci
GitOrigin-RevId: b6e4e59553a7afe0d7c8dcb2db480f3d266dbacd
上级
e4cc85e5
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
39 addition
and
3 deletion
+39
-3
CMakeLists.txt
CMakeLists.txt
+10
-0
dnn/src/fallback/conv_bias/gi/fp32/strategy_5x4.cpp
dnn/src/fallback/conv_bias/gi/fp32/strategy_5x4.cpp
+13
-0
dnn/src/fallback/conv_bias/gi/fp32/strategy_6x3.cpp
dnn/src/fallback/conv_bias/gi/fp32/strategy_6x3.cpp
+13
-0
dnn/test/fallback/gi.cpp
dnn/test/fallback/gi.cpp
+3
-3
未找到文件。
CMakeLists.txt
浏览文件 @
af6cdb20
...
@@ -453,6 +453,16 @@ if(MSVC OR WIN32)
...
@@ -453,6 +453,16 @@ if(MSVC OR WIN32)
# FIXME: fix MegRay on windows
# FIXME: fix MegRay on windows
message
(
STATUS
"Disable distributed build on windows host build..."
)
message
(
STATUS
"Disable distributed build on windows host build..."
)
set
(
MGE_WITH_DISTRIBUTED OFF
)
set
(
MGE_WITH_DISTRIBUTED OFF
)
if
(
${
MGE_ARCH
}
STREQUAL
"i386"
AND
${
CMAKE_BUILD_TYPE
}
STREQUAL
"Debug"
)
# https://docs.microsoft.com/en-us/cpp/build/reference/z7-zi-zi-debug-information-format?view=msvc-170
# Workround for error LNK1318
message
(
STATUS
"force use full symbolic debugging with build for 32bit for Windows with Debug mode"
)
set
(
CMAKE_C_FLAGS_DEBUG
"/Z7"
)
set
(
CMAKE_CXX_FLAGS_DEBUG
"/Z7"
)
endif
()
else
()
else
()
set
(
CMAKE_CXX_FLAGS
"
${
CMAKE_CXX_FLAGS
}
-Wall -Wextra"
)
set
(
CMAKE_CXX_FLAGS
"
${
CMAKE_CXX_FLAGS
}
-Wall -Wextra"
)
...
...
dnn/src/fallback/conv_bias/gi/fp32/strategy_5x4.cpp
浏览文件 @
af6cdb20
...
@@ -290,6 +290,13 @@ struct InputTransform5X4 {
...
@@ -290,6 +290,13 @@ struct InputTransform5X4 {
CONCAT(s, 4).mla(m1addm2, 0.0625f).add(m3addm4).mla(m5addm6, 16.0f); \
CONCAT(s, 4).mla(m1addm2, 0.0625f).add(m3addm4).mla(m5addm6, 16.0f); \
} while (0)
} while (0)
#if defined(__GNUC__) && !defined(__llvm__) && !defined(_MSC_VER)
#define GCC_VERSION (__GNUC__ * 10000 + __GNUC_MINOR__ * 100 + __GNUC_PATCHLEVEL__)
#if GCC_VERSION < 80000
#pragma GCC push_options
#pragma GCC optimize("O0")
#endif
#endif
template
<
BiasMode
bmode
,
typename
Op
>
template
<
BiasMode
bmode
,
typename
Op
>
struct
OutputTransform5X4
{
struct
OutputTransform5X4
{
static
void
transform
(
static
void
transform
(
...
@@ -393,6 +400,12 @@ struct OutputTransform5X4 {
...
@@ -393,6 +400,12 @@ struct OutputTransform5X4 {
}
}
}
}
};
};
#if defined(__GNUC__) && !defined(__llvm__) && !defined(_MSC_VER)
#define GCC_VERSION (__GNUC__ * 10000 + __GNUC_MINOR__ * 100 + __GNUC_PATCHLEVEL__)
#if GCC_VERSION < 80000
#pragma GCC pop_options
#endif
#endif
#undef OUTPUT_TRANSFORM
#undef OUTPUT_TRANSFORM
#undef GET_VECTOR_HIGH_ELEM
#undef GET_VECTOR_HIGH_ELEM
#undef GET_VECTOR_LOW_ELEM
#undef GET_VECTOR_LOW_ELEM
...
...
dnn/src/fallback/conv_bias/gi/fp32/strategy_6x3.cpp
浏览文件 @
af6cdb20
...
@@ -207,6 +207,13 @@ struct InputTransform6X3 {
...
@@ -207,6 +207,13 @@ struct InputTransform6X3 {
CONCAT(s, 5).mla(m3subm4, 32.f).add(m5subm6).add(m##7); \
CONCAT(s, 5).mla(m3subm4, 32.f).add(m5subm6).add(m##7); \
} while (0);
} while (0);
#if defined(__GNUC__) && !defined(__llvm__) && !defined(_MSC_VER)
#define GCC_VERSION (__GNUC__ * 10000 + __GNUC_MINOR__ * 100 + __GNUC_PATCHLEVEL__)
#if GCC_VERSION < 80000
#pragma GCC push_options
#pragma GCC optimize("O0")
#endif
#endif
template
<
BiasMode
bmode
,
typename
Op
>
template
<
BiasMode
bmode
,
typename
Op
>
struct
OutputTransform6X3
{
struct
OutputTransform6X3
{
static
void
transform
(
static
void
transform
(
...
@@ -318,6 +325,12 @@ struct OutputTransform6X3 {
...
@@ -318,6 +325,12 @@ struct OutputTransform6X3 {
}
}
}
}
};
};
#if defined(__GNUC__) && !defined(__llvm__) && !defined(_MSC_VER)
#define GCC_VERSION (__GNUC__ * 10000 + __GNUC_MINOR__ * 100 + __GNUC_PATCHLEVEL__)
#if GCC_VERSION < 80000
#pragma GCC pop_options
#endif
#endif
#undef GET_VECTOR_HIGH_ELEM
#undef GET_VECTOR_HIGH_ELEM
#undef GET_VECTOR_LOW_ELEM
#undef GET_VECTOR_LOW_ELEM
...
...
dnn/test/fallback/gi.cpp
浏览文件 @
af6cdb20
...
@@ -905,7 +905,7 @@ TEST_F(FALLBACK, GiMultiplyAddFloat32) {
...
@@ -905,7 +905,7 @@ TEST_F(FALLBACK, GiMultiplyAddFloat32) {
naive
.
push_back
(
s1
[
i
]
*
s2
[
i
]
+
s0
[
i
]);
naive
.
push_back
(
s1
[
i
]
*
s2
[
i
]
+
s0
[
i
]);
}
}
assert_
eq
((
float
*
)
&
ret
,
naive
);
assert_
lt
((
float
*
)
&
ret
,
naive
,
1e-3
);
}
}
TEST_F
(
FALLBACK
,
GiMultiplyAddScalarFloat32
)
{
TEST_F
(
FALLBACK
,
GiMultiplyAddScalarFloat32
)
{
...
@@ -2793,7 +2793,7 @@ TEST_F(FALLBACK, GiMaximumInt8) {
...
@@ -2793,7 +2793,7 @@ TEST_F(FALLBACK, GiMaximumInt8) {
for
(
size_t
i
=
0
;
i
<
SIMD_LEN_8
;
i
++
)
{
for
(
size_t
i
=
0
;
i
<
SIMD_LEN_8
;
i
++
)
{
s2
.
push_back
(
s1
[
i
]
<
s0
[
i
]
?
0xFF
:
0
);
s2
.
push_back
(
s1
[
i
]
<
s0
[
i
]
?
0xFF
:
0
);
}
}
s2
.
resize
(
SIMD_LEN
);
s2
.
resize
(
SIMD_LEN
_8
);
init
((
int8_t
*
)
&
src2
,
s2
,
SIMD_LEN_8
);
init
((
int8_t
*
)
&
src2
,
s2
,
SIMD_LEN_8
);
ret
=
GiMaximumInt8
(
src0
,
src1
);
ret
=
GiMaximumInt8
(
src0
,
src1
);
...
@@ -2853,7 +2853,7 @@ TEST_F(FALLBACK, GiMinimumInt8) {
...
@@ -2853,7 +2853,7 @@ TEST_F(FALLBACK, GiMinimumInt8) {
for
(
size_t
i
=
0
;
i
<
SIMD_LEN_8
;
i
++
)
{
for
(
size_t
i
=
0
;
i
<
SIMD_LEN_8
;
i
++
)
{
s2
.
push_back
(
s1
[
i
]
>
s0
[
i
]
?
0xFF
:
0
);
s2
.
push_back
(
s1
[
i
]
>
s0
[
i
]
?
0xFF
:
0
);
}
}
s2
.
resize
(
SIMD_LEN
);
s2
.
resize
(
SIMD_LEN
_8
);
init
((
int8_t
*
)
&
src2
,
s2
,
SIMD_LEN_8
);
init
((
int8_t
*
)
&
src2
,
s2
,
SIMD_LEN_8
);
ret
=
GiMinimumInt8
(
src0
,
src1
);
ret
=
GiMinimumInt8
(
src0
,
src1
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录