Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Greenplum
Opencv
提交
34d68edd
O
Opencv
项目概览
Greenplum
/
Opencv
11 个月 前同步成功
通知
7
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
O
Opencv
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
34d68edd
编写于
7月 18, 2016
作者:
V
Vadim Pisarevsky
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #6924 from K-Shinotsuka:issue3
上级
b6f21a6c
6f8695c1
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
22 addition
and
26 deletion
+22
-26
modules/imgproc/src/filter.cpp
modules/imgproc/src/filter.cpp
+22
-26
未找到文件。
modules/imgproc/src/filter.cpp
浏览文件 @
34d68edd
...
...
@@ -506,56 +506,52 @@ struct RowVec_8u32s
if
(
smallValues
)
{
for
(
;
i
<=
width
-
16
;
i
+=
16
)
__m128i
z
=
_mm_setzero_si128
();
for
(
;
i
<=
width
-
8
;
i
+=
8
)
{
const
uchar
*
src
=
_src
+
i
;
__m128i
f
,
z
=
_mm_setzero_si128
(),
s0
=
z
,
s1
=
z
,
s2
=
z
,
s3
=
z
;
__m128i
x0
,
x1
,
x2
,
x3
;
__m128i
s0
=
z
,
s1
=
z
;
for
(
k
=
0
;
k
<
_ksize
;
k
++
,
src
+=
cn
)
{
f
=
_mm_cvtsi32_si128
(
_kx
[
k
]);
__m128i
f
=
_mm_cvtsi32_si128
(
_kx
[
k
]);
f
=
_mm_shuffle_epi32
(
f
,
0
);
f
=
_mm_packs_epi32
(
f
,
f
);
x0
=
_mm_loadu_si128
((
const
__m128i
*
)
src
);
x2
=
_mm_unpackhi_epi8
(
x0
,
z
);
__m128i
x0
=
_mm_loadl_epi64
((
const
__m128i
*
)
src
);
x0
=
_mm_unpacklo_epi8
(
x0
,
z
);
x1
=
_mm_mulhi_epi16
(
x0
,
f
);
x3
=
_mm_mulhi_epi16
(
x2
,
f
);
x0
=
_mm_
mullo_epi16
(
x0
,
f
);
x2
=
_mm_mullo_epi16
(
x2
,
f
);
s0
=
_mm_add_epi32
(
s0
,
_mm_unpacklo_epi16
(
x0
,
x1
)
);
s1
=
_mm_add_epi32
(
s1
,
_mm_unpackhi_epi16
(
x0
,
x1
));
s
2
=
_mm_add_epi32
(
s2
,
_mm_unpacklo_epi16
(
x2
,
x3
)
);
s
3
=
_mm_add_epi32
(
s3
,
_mm_unpackhi_epi16
(
x2
,
x3
)
);
__m128i
x1
=
_mm_unpackhi_epi16
(
x0
,
z
);
x0
=
_mm_
unpacklo_epi16
(
x0
,
z
);
x0
=
_mm_madd_epi16
(
x0
,
f
);
x1
=
_mm_madd_epi16
(
x1
,
f
);
s
0
=
_mm_add_epi32
(
s0
,
x0
);
s
1
=
_mm_add_epi32
(
s1
,
x1
);
}
_mm_store_si128
((
__m128i
*
)(
dst
+
i
),
s0
);
_mm_store_si128
((
__m128i
*
)(
dst
+
i
+
4
),
s1
);
_mm_store_si128
((
__m128i
*
)(
dst
+
i
+
8
),
s2
);
_mm_store_si128
((
__m128i
*
)(
dst
+
i
+
12
),
s3
);
}
for
(
;
i
<=
width
-
4
;
i
+=
4
)
if
(
i
<=
width
-
4
)
{
const
uchar
*
src
=
_src
+
i
;
__m128i
f
,
z
=
_mm_setzero_si128
(),
s0
=
z
,
x0
,
x1
;
__m128i
s0
=
z
;
for
(
k
=
0
;
k
<
_ksize
;
k
++
,
src
+=
cn
)
{
f
=
_mm_cvtsi32_si128
(
_kx
[
k
]);
__m128i
f
=
_mm_cvtsi32_si128
(
_kx
[
k
]);
f
=
_mm_shuffle_epi32
(
f
,
0
);
f
=
_mm_packs_epi32
(
f
,
f
);
x0
=
_mm_cvtsi32_si128
(
*
(
const
int
*
)
src
);
__m128i
x0
=
_mm_cvtsi32_si128
(
*
(
const
int
*
)
src
);
x0
=
_mm_unpacklo_epi8
(
x0
,
z
);
x
1
=
_mm_mulhi_epi16
(
x0
,
f
);
x0
=
_mm_m
ullo
_epi16
(
x0
,
f
);
s0
=
_mm_add_epi32
(
s0
,
_mm_unpacklo_epi16
(
x0
,
x1
)
);
x
0
=
_mm_unpacklo_epi16
(
x0
,
z
);
x0
=
_mm_m
add
_epi16
(
x0
,
f
);
s0
=
_mm_add_epi32
(
s0
,
x0
);
}
_mm_store_si128
((
__m128i
*
)(
dst
+
i
),
s0
);
i
+=
4
;
}
}
return
i
;
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录