Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Greenplum
Opencv
提交
9cacd326
O
Opencv
项目概览
Greenplum
/
Opencv
11 个月 前同步成功
通知
7
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
O
Opencv
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
9cacd326
编写于
1月 12, 2015
作者:
I
Ilya Lavrenov
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
cvtColor BGR5x5 2 Gray
上级
edee922b
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
78 addition
and
1 deletion
+78
-1
modules/imgproc/perf/perf_cvt_color.cpp
modules/imgproc/perf/perf_cvt_color.cpp
+1
-1
modules/imgproc/src/color.cpp
modules/imgproc/src/color.cpp
+77
-0
未找到文件。
modules/imgproc/perf/perf_cvt_color.cpp
浏览文件 @
9cacd326
...
...
@@ -204,7 +204,7 @@ PERF_TEST_P(Size_CvtMode, cvtColor8u,
)
{
Size
sz
=
GetParam
();
int
mode
=
COLOR_
RGB2YCrCb
;
int
mode
=
COLOR_
YCrCb2RGB
;
ChPair
ch
=
getConversionInfo
(
mode
);
mode
%=
COLOR_COLORCVT_MAX
;
...
...
modules/imgproc/src/color.cpp
浏览文件 @
9cacd326
...
...
@@ -1125,6 +1125,13 @@ struct RGB5x52Gray
v_delta
=
vdupq_n_u32
(
1
<<
(
yuv_shift
-
1
));
v_f8
=
vdupq_n_u16
(
0xf8
);
v_fc
=
vdupq_n_u16
(
0xfc
);
#elif CV_SSE2
v_b2y
=
_mm_set1_epi16
(
B2Y
);
v_g2y
=
_mm_set1_epi16
(
G2Y
);
v_r2y
=
_mm_set1_epi16
(
R2Y
);
v_delta
=
_mm_set1_epi32
(
1
<<
(
yuv_shift
-
1
));
v_f8
=
_mm_set1_epi16
(
0xf8
);
v_fc
=
_mm_set1_epi16
(
0xfc
);
#endif
}
...
...
@@ -1150,6 +1157,39 @@ struct RGB5x52Gray
vst1_u8
(
dst
+
i
,
vmovn_u16
(
vcombine_u16
(
vmovn_u32
(
v_dst0
),
vmovn_u32
(
v_dst1
))));
}
#elif CV_SSE2
__m128i
v_zero
=
_mm_setzero_si128
();
for
(
;
i
<=
n
-
8
;
i
+=
8
)
{
__m128i
v_src
=
_mm_loadu_si128
((
__m128i
const
*
)((
ushort
*
)
src
+
i
));
__m128i
v_t0
=
_mm_and_si128
(
_mm_slli_epi16
(
v_src
,
3
),
v_f8
),
v_t1
=
_mm_and_si128
(
_mm_srli_epi16
(
v_src
,
3
),
v_fc
),
v_t2
=
_mm_and_si128
(
_mm_srli_epi16
(
v_src
,
8
),
v_f8
);
__m128i
v_mullo_b
=
_mm_mullo_epi16
(
v_t0
,
v_b2y
);
__m128i
v_mullo_g
=
_mm_mullo_epi16
(
v_t1
,
v_g2y
);
__m128i
v_mullo_r
=
_mm_mullo_epi16
(
v_t2
,
v_r2y
);
__m128i
v_mulhi_b
=
_mm_mulhi_epi16
(
v_t0
,
v_b2y
);
__m128i
v_mulhi_g
=
_mm_mulhi_epi16
(
v_t1
,
v_g2y
);
__m128i
v_mulhi_r
=
_mm_mulhi_epi16
(
v_t2
,
v_r2y
);
__m128i
v_dst0
=
_mm_add_epi32
(
_mm_unpacklo_epi16
(
v_mullo_b
,
v_mulhi_b
),
_mm_unpacklo_epi16
(
v_mullo_g
,
v_mulhi_g
));
v_dst0
=
_mm_add_epi32
(
_mm_add_epi32
(
v_dst0
,
v_delta
),
_mm_unpacklo_epi16
(
v_mullo_r
,
v_mulhi_r
));
__m128i
v_dst1
=
_mm_add_epi32
(
_mm_unpackhi_epi16
(
v_mullo_b
,
v_mulhi_b
),
_mm_unpackhi_epi16
(
v_mullo_g
,
v_mulhi_g
));
v_dst1
=
_mm_add_epi32
(
_mm_add_epi32
(
v_dst1
,
v_delta
),
_mm_unpackhi_epi16
(
v_mullo_r
,
v_mulhi_r
));
v_dst0
=
_mm_srli_epi32
(
v_dst0
,
yuv_shift
);
v_dst1
=
_mm_srli_epi32
(
v_dst1
,
yuv_shift
);
__m128i
v_dst
=
_mm_packs_epi32
(
v_dst0
,
v_dst1
);
_mm_storel_epi64
((
__m128i
*
)(
dst
+
i
),
_mm_packus_epi16
(
v_dst
,
v_zero
));
}
#endif
for
(
;
i
<
n
;
i
++
)
{
...
...
@@ -1178,6 +1218,39 @@ struct RGB5x52Gray
vst1_u8
(
dst
+
i
,
vmovn_u16
(
vcombine_u16
(
vmovn_u32
(
v_dst0
),
vmovn_u32
(
v_dst1
))));
}
#elif CV_SSE2
__m128i
v_zero
=
_mm_setzero_si128
();
for
(
;
i
<=
n
-
8
;
i
+=
8
)
{
__m128i
v_src
=
_mm_loadu_si128
((
__m128i
const
*
)((
ushort
*
)
src
+
i
));
__m128i
v_t0
=
_mm_and_si128
(
_mm_slli_epi16
(
v_src
,
3
),
v_f8
),
v_t1
=
_mm_and_si128
(
_mm_srli_epi16
(
v_src
,
2
),
v_f8
),
v_t2
=
_mm_and_si128
(
_mm_srli_epi16
(
v_src
,
7
),
v_f8
);
__m128i
v_mullo_b
=
_mm_mullo_epi16
(
v_t0
,
v_b2y
);
__m128i
v_mullo_g
=
_mm_mullo_epi16
(
v_t1
,
v_g2y
);
__m128i
v_mullo_r
=
_mm_mullo_epi16
(
v_t2
,
v_r2y
);
__m128i
v_mulhi_b
=
_mm_mulhi_epi16
(
v_t0
,
v_b2y
);
__m128i
v_mulhi_g
=
_mm_mulhi_epi16
(
v_t1
,
v_g2y
);
__m128i
v_mulhi_r
=
_mm_mulhi_epi16
(
v_t2
,
v_r2y
);
__m128i
v_dst0
=
_mm_add_epi32
(
_mm_unpacklo_epi16
(
v_mullo_b
,
v_mulhi_b
),
_mm_unpacklo_epi16
(
v_mullo_g
,
v_mulhi_g
));
v_dst0
=
_mm_add_epi32
(
_mm_add_epi32
(
v_dst0
,
v_delta
),
_mm_unpacklo_epi16
(
v_mullo_r
,
v_mulhi_r
));
__m128i
v_dst1
=
_mm_add_epi32
(
_mm_unpackhi_epi16
(
v_mullo_b
,
v_mulhi_b
),
_mm_unpackhi_epi16
(
v_mullo_g
,
v_mulhi_g
));
v_dst1
=
_mm_add_epi32
(
_mm_add_epi32
(
v_dst1
,
v_delta
),
_mm_unpackhi_epi16
(
v_mullo_r
,
v_mulhi_r
));
v_dst0
=
_mm_srli_epi32
(
v_dst0
,
yuv_shift
);
v_dst1
=
_mm_srli_epi32
(
v_dst1
,
yuv_shift
);
__m128i
v_dst
=
_mm_packs_epi32
(
v_dst0
,
v_dst1
);
_mm_storel_epi64
((
__m128i
*
)(
dst
+
i
),
_mm_packus_epi16
(
v_dst
,
v_zero
));
}
#endif
for
(
;
i
<
n
;
i
++
)
{
...
...
@@ -1194,6 +1267,10 @@ struct RGB5x52Gray
uint16x4_t
v_b2y
,
v_g2y
,
v_r2y
;
uint32x4_t
v_delta
;
uint16x8_t
v_f8
,
v_fc
;
#elif CV_SSE2
__m128i
v_b2y
,
v_g2y
,
v_r2y
;
__m128i
v_delta
;
__m128i
v_f8
,
v_fc
;
#endif
};
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录