Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
Paddle
提交
734cac1a
P
Paddle
项目概览
BaiXuePrincess
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
734cac1a
编写于
11月 17, 2017
作者:
K
Kexin Zhao
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix CUDA_VERSION issue
上级
080ff0c8
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
32 addition
and
1 deletion
+32
-1
paddle/math/float16.h
paddle/math/float16.h
+28
-1
paddle/math/tests/test_float16.cpp
paddle/math/tests/test_float16.cpp
+2
-0
paddle/math/tests/test_float16.cu
paddle/math/tests/test_float16.cu
+2
-0
未找到文件。
paddle/math/float16.h
浏览文件 @
734cac1a
...
@@ -20,6 +20,10 @@ limitations under the License. */
...
@@ -20,6 +20,10 @@ limitations under the License. */
#include <istream>
#include <istream>
#include <ostream>
#include <ostream>
#include <cuda.h>
#include "paddle/utils/Logging.h"
#define USE_EIGEN
#define USE_EIGEN
#ifdef USE_EIGEN // delete this #if macro
#ifdef USE_EIGEN // delete this #if macro
...
@@ -48,6 +52,27 @@ limitations under the License. */
...
@@ -48,6 +52,27 @@ limitations under the License. */
#define PADDLE_HOSTDEVICE
#define PADDLE_HOSTDEVICE
#endif // __CUDACC__
#endif // __CUDACC__
#define STR(x) #x
#define XSTR(x) STR(x)
#ifndef __CUDACC__
#pragma message "__CUDACC__ not defined"
#else
#pragma message "__CUDACC__ defined"
#endif
#ifndef CUDA_VERSION
#pragma message "CUDA_VERSION not defined"
#else
#pragma message "CUDA_VERSION defined: " XSTR(CUDA_VERSION)
#endif
#ifdef __CUDA_ARCH__
#pragma message "The value of CUDA_ARCH: " XSTR(__CUDA_ARCH__)
#else
#pragma message "CUDA ARCH NOT DEFINED!"
#endif
#ifdef __arm__
#ifdef __arm__
#define PADDLE_ARM_32
#define PADDLE_ARM_32
#endif
#endif
...
@@ -359,6 +384,7 @@ struct PADDLE_ALIGN(2) float16 {
...
@@ -359,6 +384,7 @@ struct PADDLE_ALIGN(2) float16 {
// arithmetic operators
// arithmetic operators
#if defined(PADDLE_CUDA_FP16) && defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 530
#if defined(PADDLE_CUDA_FP16) && defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 530
__device__
inline
float16
operator
+
(
const
float16
&
a
,
const
float16
&
b
)
{
__device__
inline
float16
operator
+
(
const
float16
&
a
,
const
float16
&
b
)
{
printf
(
"GPU Intrinsic used!"
);
return
float16
(
__hadd
(
half
(
a
),
half
(
b
)));
return
float16
(
__hadd
(
half
(
a
),
half
(
b
)));
}
}
...
@@ -495,6 +521,7 @@ __host__ inline bool operator>=(const float16& a, const float16& b) {
...
@@ -495,6 +521,7 @@ __host__ inline bool operator>=(const float16& a, const float16& b) {
#else // software emulation on other cpu
#else // software emulation on other cpu
PADDLE_HOSTDEVICE
inline
float16
operator
+
(
const
float16
&
a
,
const
float16
&
b
)
{
PADDLE_HOSTDEVICE
inline
float16
operator
+
(
const
float16
&
a
,
const
float16
&
b
)
{
LOG
(
INFO
)
<<
"CPU emulation used"
;
return
float16
(
float
(
a
)
+
float
(
b
));
return
float16
(
float
(
a
)
+
float
(
b
));
}
}
...
@@ -656,7 +683,7 @@ PADDLE_HOSTDEVICE inline float16 float_to_half_rn(float f) {
...
@@ -656,7 +683,7 @@ PADDLE_HOSTDEVICE inline float16 float_to_half_rn(float f) {
PADDLE_HOSTDEVICE
inline
float
half_to_float
(
float16
h
)
{
PADDLE_HOSTDEVICE
inline
float
half_to_float
(
float16
h
)
{
#if defined(PADDLE_CUDA_FP16) && defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 300
#if defined(PADDLE_CUDA_FP16) && defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 300
half
tmp
=
*
reinterpret_cast
<
half
*>
(
&
h
);
half
tmp
=
*
reinterpret_cast
<
half
*>
(
&
h
);
return
__half2float
(
h
);
return
__half2float
(
tmp
);
#elif defined(PADDLE_NEON_64)
#elif defined(PADDLE_NEON_64)
float
res
;
float
res
;
...
...
paddle/math/tests/test_float16.cpp
浏览文件 @
734cac1a
...
@@ -15,6 +15,8 @@ limitations under the License. */
...
@@ -15,6 +15,8 @@ limitations under the License. */
namespace
paddle
{
namespace
paddle
{
TEST
(
float16
,
conversion_cpu
)
{
TEST
(
float16
,
conversion_cpu
)
{
LOG
(
INFO
)
<<
"cpu test started!"
;
// Conversion to and from Eigen::half
// Conversion to and from Eigen::half
EXPECT_EQ
(
float16
(
Eigen
::
half
(
float16
(
1.0
f
))).
x
,
0x3c00
);
EXPECT_EQ
(
float16
(
Eigen
::
half
(
float16
(
1.0
f
))).
x
,
0x3c00
);
EXPECT_EQ
(
float16
(
Eigen
::
half
(
float16
(
0.5
f
))).
x
,
0x3800
);
EXPECT_EQ
(
float16
(
Eigen
::
half
(
float16
(
0.5
f
))).
x
,
0x3800
);
...
...
paddle/math/tests/test_float16.cu
浏览文件 @
734cac1a
...
@@ -16,6 +16,8 @@ namespace paddle {
...
@@ -16,6 +16,8 @@ namespace paddle {
#ifdef PADDLE_CUDA_FP16
#ifdef PADDLE_CUDA_FP16
TEST
(
float16
,
conversion_gpu
)
{
TEST
(
float16
,
conversion_gpu
)
{
LOG
(
INFO
)
<<
"GPU tests started"
;
// Conversion to and from cuda half
// Conversion to and from cuda half
float16
v1
=
half
(
float16
(
1.0
f
));
float16
v1
=
half
(
float16
(
1.0
f
));
EXPECT_EQ
(
v1
.
x
,
0x3c00
);
EXPECT_EQ
(
v1
.
x
,
0x3c00
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录