Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleDetection
提交
af37838e
P
PaddleDetection
项目概览
s920243400
/
PaddleDetection
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleDetection
通知
2
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleDetection
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
af37838e
编写于
11月 15, 2017
作者:
K
Kexin Zhao
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add test for float16
上级
d9642cb3
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
10 addition
and
9 deletion
+10
-9
paddle/math/float16.h
paddle/math/float16.h
+8
-8
paddle/math/tests/CMakeLists.txt
paddle/math/tests/CMakeLists.txt
+2
-1
未找到文件。
paddle/math/float16.h
浏览文件 @
af37838e
...
@@ -20,7 +20,7 @@ limitations under the License. */
...
@@ -20,7 +20,7 @@ limitations under the License. */
#include <istream>
#include <istream>
#include <ostream>
#include <ostream>
#
include <cuda.h>
#
define USE_EIGEN
#ifdef USE_EIGEN // delete this #if macro
#ifdef USE_EIGEN // delete this #if macro
#include "Eigen/src/Core/arch/CUDA/Half.h"
#include "Eigen/src/Core/arch/CUDA/Half.h"
...
@@ -100,8 +100,6 @@ PADDLE_HOSTDEVICE inline float half_to_float(float16 h);
...
@@ -100,8 +100,6 @@ PADDLE_HOSTDEVICE inline float half_to_float(float16 h);
struct
PADDLE_ALIGN
(
2
)
float16
{
struct
PADDLE_ALIGN
(
2
)
float16
{
uint16_t
x
;
uint16_t
x
;
// explicit for different types, implicit for half and Eigen::half
PADDLE_HOSTDEVICE
inline
float16
()
{}
PADDLE_HOSTDEVICE
inline
float16
()
{}
PADDLE_HOSTDEVICE
inline
float16
(
const
float16
&
h
)
:
x
(
h
.
x
)
{}
PADDLE_HOSTDEVICE
inline
float16
(
const
float16
&
h
)
:
x
(
h
.
x
)
{}
...
@@ -120,7 +118,8 @@ struct PADDLE_ALIGN(2) float16 {
...
@@ -120,7 +118,8 @@ struct PADDLE_ALIGN(2) float16 {
PADDLE_HOSTDEVICE
inline
float16
(
const
Eigen
::
half
&
h
)
:
x
(
h
.
x
)
{}
PADDLE_HOSTDEVICE
inline
float16
(
const
Eigen
::
half
&
h
)
:
x
(
h
.
x
)
{}
#endif // USE_EIGEN
#endif // USE_EIGEN
#ifdef PADDLE_NEON
#if (PADDLE_GNUC_VER >= 61 || PADDLE_CLANG_VER >= 34) && \
defined(PADDLE_NEON) && defined(PADDLE_ARM_FP16)
// __fp16 is a native half precision data type for arm cpu,
// __fp16 is a native half precision data type for arm cpu,
// float16_t is an alias for __fp16 in arm_fp16.h,
// float16_t is an alias for __fp16 in arm_fp16.h,
// which is included in arm_neon.h.
// which is included in arm_neon.h.
...
@@ -208,7 +207,8 @@ struct PADDLE_ALIGN(2) float16 {
...
@@ -208,7 +207,8 @@ struct PADDLE_ALIGN(2) float16 {
}
}
#endif // USE_EIGEN
#endif // USE_EIGEN
#ifdef PADDLE_NEON
#if (PADDLE_GNUC_VER >= 61 || PADDLE_CLANG_VER >= 34) && \
defined(PADDLE_NEON) && defined(PADDLE_ARM_FP16)
PADDLE_HOSTDEVICE
inline
float16
&
operator
=
(
const
float16_t
*
rhs
)
{
PADDLE_HOSTDEVICE
inline
float16
&
operator
=
(
const
float16_t
*
rhs
)
{
x
=
*
reinterpret_cast
<
uint16_t
*>
(
rhs
);
x
=
*
reinterpret_cast
<
uint16_t
*>
(
rhs
);
return
*
this
;
return
*
this
;
...
@@ -302,7 +302,8 @@ struct PADDLE_ALIGN(2) float16 {
...
@@ -302,7 +302,8 @@ struct PADDLE_ALIGN(2) float16 {
}
}
#endif // USE_EIGEN
#endif // USE_EIGEN
#ifdef PADDLE_NEON
#if (PADDLE_GNUC_VER >= 61 || PADDLE_CLANG_VER >= 34) && \
defined(PADDLE_NEON) && defined(PADDLE_ARM_FP16)
// check whether it works or not
// check whether it works or not
PADDLE_HOSTDEVICE
inline
operator
float16_t
()
const
{
PADDLE_HOSTDEVICE
inline
operator
float16_t
()
const
{
float16
h
=
*
this
;
float16
h
=
*
this
;
...
@@ -371,7 +372,6 @@ __device__ inline float16 operator*(const float16& a, const float16& b) {
...
@@ -371,7 +372,6 @@ __device__ inline float16 operator*(const float16& a, const float16& b) {
__device__
inline
float16
operator
/
(
const
float16
&
a
,
const
float16
&
b
)
{
__device__
inline
float16
operator
/
(
const
float16
&
a
,
const
float16
&
b
)
{
// TODO(kexinzhao): check the cuda version that starts to support __hdiv
// TODO(kexinzhao): check the cuda version that starts to support __hdiv
// instinsic
float
num
=
__half2float
(
half
(
a
));
float
num
=
__half2float
(
half
(
a
));
float
denom
=
__half2float
(
half
(
b
));
float
denom
=
__half2float
(
half
(
b
));
return
float16
(
num
/
denom
);
return
float16
(
num
/
denom
);
...
@@ -595,7 +595,7 @@ constexpr int32_t minD = minC - subC - 1;
...
@@ -595,7 +595,7 @@ constexpr int32_t minD = minC - subC - 1;
PADDLE_HOSTDEVICE
inline
float16
float_to_half_rn
(
float
f
)
{
PADDLE_HOSTDEVICE
inline
float16
float_to_half_rn
(
float
f
)
{
#if defined(PADDLE_CUDA_FP16) && defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 300
#if defined(PADDLE_CUDA_FP16) && defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 300
half
tmp
=
__float2half
(
f
);
half
tmp
=
__float2half
(
f
);
return
*
reinterpret_cast
<
float16
*>
(
&
(
tmp
)
);
return
*
reinterpret_cast
<
float16
*>
(
&
tmp
);
#elif defined(PADDLE_NEON_64) // test on RPI
#elif defined(PADDLE_NEON_64) // test on RPI
float16
res
;
float16
res
;
...
...
paddle/math/tests/CMakeLists.txt
浏览文件 @
af37838e
...
@@ -21,7 +21,7 @@ if(WITH_GPU)
...
@@ -21,7 +21,7 @@ if(WITH_GPU)
CUDA_ADD_EXECUTABLE
(
test_Tensor test_Tensor.cu
)
CUDA_ADD_EXECUTABLE
(
test_Tensor test_Tensor.cu
)
link_paddle_test
(
test_Tensor
)
link_paddle_test
(
test_Tensor
)
CUDA_ADD_EXECUTABLE
(
test_lazyAssign test_lazyAssign.cu
)
CUDA_ADD_EXECUTABLE
(
test_lazyAssign test_lazyAssign.cu
)
link_paddle_test
(
test_lazyAssign
)
link_paddle_test
(
test_lazyAssign
)
else
()
else
()
compile_cu_as_cpp
(
test_Tensor.cu
)
compile_cu_as_cpp
(
test_Tensor.cu
)
add_unittest
(
test_Tensor test_Tensor.cu
)
add_unittest
(
test_Tensor test_Tensor.cu
)
...
@@ -33,3 +33,4 @@ add_simple_unittest(test_FPException)
...
@@ -33,3 +33,4 @@ add_simple_unittest(test_FPException)
add_simple_unittest
(
test_GpuProfiler
)
add_simple_unittest
(
test_GpuProfiler
)
add_simple_unittest
(
test_BaseMatrix
)
add_simple_unittest
(
test_BaseMatrix
)
add_simple_unittest
(
test_Matrix
)
add_simple_unittest
(
test_Matrix
)
add_simple_unittest
(
test_float16
)
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录