Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
Paddle
提交
0294ab41
P
Paddle
项目概览
BaiXuePrincess
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
0294ab41
编写于
1月 13, 2023
作者:
Z
zhangkaihuo
提交者:
GitHub
1月 13, 2023
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update threshold of bn1d (#49734)
上级
609b50a8
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
7 addition
and
9 deletion
+7
-9
paddle/phi/kernels/funcs/norm_utils.h
paddle/phi/kernels/funcs/norm_utils.h
+4
-0
paddle/phi/kernels/gpu/batch_norm_grad_kernel.cu
paddle/phi/kernels/gpu/batch_norm_grad_kernel.cu
+1
-4
paddle/phi/kernels/gpu/batch_norm_kernel.cu
paddle/phi/kernels/gpu/batch_norm_kernel.cu
+2
-5
未找到文件。
paddle/phi/kernels/funcs/norm_utils.h
浏览文件 @
0294ab41
...
...
@@ -18,6 +18,10 @@ limitations under the License. */
namespace
phi
{
namespace
funcs
{
#define CUDNN_PER_ACTIVATION_THRESHOLD 10240
#define CUDNN_SPATIAL_THRESHOLD_TRAIN 880801
#define CUDNN_SPATIAL_THRESHOLD_EVAL 65535
inline
void
ExtractNCWHD
(
const
phi
::
DDim
&
dims
,
const
DataLayout
&
data_layout
,
int
*
N
,
...
...
paddle/phi/kernels/gpu/batch_norm_grad_kernel.cu
浏览文件 @
0294ab41
...
...
@@ -907,15 +907,12 @@ void BatchNormGradRawKernel(const Context &ctx,
#else
}
// CUDNN only support small batch size
// const size_t CUDNN_PER_ACTIVATION_THRESHOLD = 131070;
const
size_t
CUDNN_PER_ACTIVATION_THRESHOLD
=
10240
;
const
size_t
CUDNN_SPATIAL_THRESHOLD
=
880801
;
bool
use_native_nhwc
=
d_x
?
(
x_dims
.
size
()
==
4
&&
compute_format
==
DataLayout
::
kNHWC
)
:
false
;
const
bool
use_native_kernel
=
((
x_dims
.
size
()
==
2
&&
N
>=
CUDNN_PER_ACTIVATION_THRESHOLD
)
||
(
x_dims
.
size
()
==
3
&&
N
>=
CUDNN_SPATIAL_THRESHOLD
));
(
x_dims
.
size
()
==
3
&&
N
>=
CUDNN_SPATIAL_THRESHOLD
_TRAIN
));
if
(
use_native_nhwc
||
(
d_x
&&
d_scale
&&
d_bias
))
{
if
(
use_native_kernel
||
use_native_nhwc
)
{
if
(
x_dims
.
size
()
==
2
||
use_native_nhwc
)
{
...
...
paddle/phi/kernels/gpu/batch_norm_kernel.cu
浏览文件 @
0294ab41
...
...
@@ -722,9 +722,6 @@ void BatchNormKernel(const Context &ctx,
auto
handle
=
ctx
.
cudnn_handle
();
const
size_t
CUDNN_PER_ACTIVATION_THRESHOLD
=
10240
;
const
size_t
CUDNN_SPATIAL_THRESHOLD
=
880801
;
// Now, depending on whether we are running test or not, we have two paths.
// It is training mode when it's not reference AND not using pre-trained
// model.
...
...
@@ -829,7 +826,7 @@ void BatchNormKernel(const Context &ctx,
#else
const
bool
use_native_kernel
=
(
x_dims
.
size
()
==
2
||
(
x_dims
.
size
()
==
3
&&
N
>=
CUDNN_SPATIAL_THRESHOLD
));
(
x_dims
.
size
()
==
3
&&
N
>=
CUDNN_SPATIAL_THRESHOLD
_EVAL
));
if
(
use_native_kernel
)
{
const
int
block_size
=
256
;
const
int
grid_size
=
(
N
*
C
*
H
*
W
*
D
+
block_size
-
1
)
/
block_size
;
...
...
@@ -1005,7 +1002,7 @@ void BatchNormKernel(const Context &ctx,
// const size_t CUDNN_PER_ACTIVATION_THRESHOLD = 131070;
const
bool
use_native_kernel
=
((
x_dims
.
size
()
==
2
&&
N
>=
CUDNN_PER_ACTIVATION_THRESHOLD
)
||
(
x_dims
.
size
()
==
3
&&
N
>=
CUDNN_SPATIAL_THRESHOLD
));
(
x_dims
.
size
()
==
3
&&
N
>=
CUDNN_SPATIAL_THRESHOLD
_TRAIN
));
if
(
use_native_kernel
)
{
dim3
block
;
dim3
grid
;
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录