Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Greenplum
Opencv
提交
e23b59da
O
Opencv
项目概览
Greenplum
/
Opencv
大约 1 年 前同步成功
通知
7
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
O
Opencv
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
e23b59da
编写于
6月 13, 2017
作者:
A
Alexander Alekhin
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
build: fix v_reduce_sum4 (requires SSE3)
上级
f49f056d
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
24 addition
and
0 deletion
+24
-0
modules/core/include/opencv2/core/hal/intrin_sse.hpp
modules/core/include/opencv2/core/hal/intrin_sse.hpp
+6
-0
modules/core/test/test_intrin.cpp
modules/core/test/test_intrin.cpp
+18
-0
未找到文件。
modules/core/include/opencv2/core/hal/intrin_sse.hpp
浏览文件 @
e23b59da
...
...
@@ -1129,9 +1129,15 @@ OPENCV_HAL_IMPL_SSE_REDUCE_OP_4_SUM(v_float32x4, float, __m128, ps, _mm_castps_s
inline
v_float32x4
v_reduce_sum4
(
const
v_float32x4
&
a
,
const
v_float32x4
&
b
,
const
v_float32x4
&
c
,
const
v_float32x4
&
d
)
{
#if CV_SSE3
__m128
ab
=
_mm_hadd_ps
(
a
.
val
,
b
.
val
);
__m128
cd
=
_mm_hadd_ps
(
c
.
val
,
d
.
val
);
return
v_float32x4
(
_mm_hadd_ps
(
ab
,
cd
));
#else
__m128
ac
=
_mm_add_ps
(
_mm_unpacklo_ps
(
a
.
val
,
c
.
val
),
_mm_unpackhi_ps
(
a
.
val
,
c
.
val
));
__m128
bd
=
_mm_add_ps
(
_mm_unpacklo_ps
(
b
.
val
,
d
.
val
),
_mm_unpackhi_ps
(
b
.
val
,
d
.
val
));
return
v_float32x4
(
_mm_add_ps
(
_mm_unpacklo_ps
(
ac
,
bd
),
_mm_unpackhi_ps
(
ac
,
bd
)));
#endif
}
OPENCV_HAL_IMPL_SSE_REDUCE_OP_4
(
v_uint32x4
,
unsigned
,
max
,
std
::
max
)
...
...
modules/core/test/test_intrin.cpp
浏览文件 @
e23b59da
...
...
@@ -741,6 +741,23 @@ template<typename R> struct TheTest
return
*
this
;
}
TheTest
&
test_reduce_sum4
()
{
R
a
(
0.1
f
,
0.02
f
,
0.003
f
,
0.0004
f
);
R
b
(
1
,
20
,
300
,
4000
);
R
c
(
10
,
2
,
0.3
f
,
0.04
f
);
R
d
(
1
,
2
,
3
,
4
);
R
sum
=
v_reduce_sum4
(
a
,
b
,
c
,
d
);
Data
<
R
>
res
=
sum
;
EXPECT_EQ
(
0.1234
f
,
res
[
0
]);
EXPECT_EQ
(
4321.0
f
,
res
[
1
]);
EXPECT_EQ
(
12.34
f
,
res
[
2
]);
EXPECT_EQ
(
10.0
f
,
res
[
3
]);
return
*
this
;
}
TheTest
&
test_loadstore_fp16
()
{
#if CV_FP16 && CV_SIMD128
...
...
@@ -986,6 +1003,7 @@ TEST(hal_intrin, float32x4) {
.
test_float_cvt64
()
.
test_matmul
()
.
test_transpose
()
.
test_reduce_sum4
()
;
}
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录