Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Greenplum
Opencv
提交
32c23908
O
Opencv
项目概览
Greenplum
/
Opencv
11 个月 前同步成功
通知
7
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
O
Opencv
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
32c23908
编写于
8月 09, 2016
作者:
A
Alexander Alekhin
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #7067 from tomoaki0705:fixBuildErrorJetsonK1
上级
c1d73e4f
3debc78a
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
12 addition
and
2 deletion
+12
-2
modules/core/src/convert.cpp
modules/core/src/convert.cpp
+12
-2
未找到文件。
modules/core/src/convert.cpp
浏览文件 @
32c23908
...
...
@@ -4545,6 +4545,16 @@ static short convertFp16SW(float fp32)
}
#endif
#if CV_FP16 && (defined __GNUC__) && (defined __arm__ || defined __aarch64__)
#if 5 <= __GNUC__
static
inline
float16x4_t
load_f16
(
const
short
*
p
)
{
return
vld1_f16
((
const
float16_t
*
)
p
);
}
static
inline
void
store_f16
(
short
*
p
,
float16x4_t
v
)
{
vst1_f16
((
float16_t
*
)
p
,
v
);
}
#else
static
inline
float16x4_t
load_f16
(
const
short
*
p
)
{
return
(
float16x4_t
)
vld1_s16
(
p
);
}
static
inline
void
store_f16
(
short
*
p
,
float16x4_t
v
)
{
vst1_s16
(
p
,
(
int16x4_t
)
v
);
}
#endif
#endif
// template for FP16 HW conversion function
template
<
typename
T
,
typename
DT
>
static
void
cvtScaleHalf_
(
const
T
*
src
,
size_t
sstep
,
DT
*
dst
,
size_t
dstep
,
Size
size
);
...
...
@@ -4579,7 +4589,7 @@ cvtScaleHalf_<float, short>( const float* src, size_t sstep, short* dst, size_t
float16x4_t
v_dst
=
vcvt_f16_f32
(
v_src
);
vst1_f16
((
float16_t
*
)(
dst
+
x
)
,
v_dst
);
store_f16
(
dst
+
x
,
v_dst
);
#else
#error "Configuration error"
#endif
...
...
@@ -4631,7 +4641,7 @@ cvtScaleHalf_<short, float>( const short* src, size_t sstep, float* dst, size_t
_mm_storeu_ps
(
dst
+
x
,
v_dst
);
#elif defined __GNUC__ && (defined __arm__ || defined __aarch64__)
float16x4_t
v_src
=
vld1_f16
((
float16_t
*
)(
src
+
x
)
);
float16x4_t
v_src
=
load_f16
(
src
+
x
);
float32x4_t
v_dst
=
vcvt_f32_f16
(
v_src
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录