Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
20d168d9
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
20d168d9
编写于
9月 14, 2022
作者:
Y
ykkk2333
提交者:
GitHub
9月 14, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix transformer bug, test=kunlun (#45983)
上级
9d5003dc
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
26 addition
and
18 deletion
+26
-18
paddle/phi/kernels/xpu/adam_kernel.cc
paddle/phi/kernels/xpu/adam_kernel.cc
+2
-2
paddle/phi/kernels/xpu/arange_kernel.cc
paddle/phi/kernels/xpu/arange_kernel.cc
+23
-15
paddle/phi/kernels/xpu/gaussian_random_kernel.cc
paddle/phi/kernels/xpu/gaussian_random_kernel.cc
+1
-1
未找到文件。
paddle/phi/kernels/xpu/adam_kernel.cc
浏览文件 @
20d168d9
...
...
@@ -65,7 +65,7 @@ void AdamDenseKernel(const Context& dev_ctx,
const
float
*
beta1_const_pow_ptr
=
nullptr
;
if
(
beta1_pow
.
place
()
==
CPUPlace
())
{
DenseTensor
xpu_beta1_pow
;
phi
::
Copy
(
dev_ctx
,
beta1_pow
,
beta1_pow
.
p
lace
(),
false
,
&
xpu_beta1_pow
);
phi
::
Copy
(
dev_ctx
,
beta1_pow
,
dev_ctx
.
GetP
lace
(),
false
,
&
xpu_beta1_pow
);
if
(
xpu_beta1_pow
.
dtype
()
==
DataType
::
FLOAT16
)
funcs
::
GetDataPointer
<
Context
,
float
>
(
xpu_beta1_pow
,
&
beta1_pow_ptr
,
dev_ctx
);
...
...
@@ -82,7 +82,7 @@ void AdamDenseKernel(const Context& dev_ctx,
const
float
*
beta2_const_pow_ptr
=
nullptr
;
if
(
beta2_pow
.
place
()
==
CPUPlace
())
{
DenseTensor
xpu_beta2_pow
;
phi
::
Copy
(
dev_ctx
,
beta2_pow
,
beta2_pow
.
p
lace
(),
false
,
&
xpu_beta2_pow
);
phi
::
Copy
(
dev_ctx
,
beta2_pow
,
dev_ctx
.
GetP
lace
(),
false
,
&
xpu_beta2_pow
);
if
(
xpu_beta2_pow
.
dtype
()
==
DataType
::
FLOAT16
)
funcs
::
GetDataPointer
<
Context
,
float
>
(
xpu_beta2_pow
,
&
beta2_pow_ptr
,
dev_ctx
);
...
...
paddle/phi/kernels/xpu/arange_kernel.cc
浏览文件 @
20d168d9
...
...
@@ -20,6 +20,18 @@ limitations under the License. */
namespace
phi
{
template
<
typename
T
,
typename
Context
>
inline
T
GetValue
(
const
Context
&
dev_ctx
,
const
DenseTensor
&
x
)
{
T
value
=
static_cast
<
T
>
(
0
);
if
(
x
.
place
()
!=
CPUPlace
())
{
DenseTensor
cpu_x
;
Copy
(
dev_ctx
,
x
,
CPUPlace
(),
true
,
&
cpu_x
);
value
=
cpu_x
.
data
<
T
>
()[
0
];
}
else
{
value
=
x
.
data
<
T
>
()[
0
];
}
return
value
;
}
template
<
typename
T
,
typename
Context
>
void
ArangeKernel
(
const
Context
&
dev_ctx
,
const
DenseTensor
&
start
,
...
...
@@ -29,19 +41,9 @@ void ArangeKernel(const Context& dev_ctx,
auto
place
=
dev_ctx
.
GetPlace
();
auto
cpu_place
=
phi
::
CPUPlace
();
DenseTensor
n_cpu
;
n_cpu
.
Resize
({
start
.
numel
()});
T
*
n_cpu_data
=
dev_ctx
.
template
HostAlloc
<
T
>(
&
n_cpu
);
paddle
::
memory
::
Copy
(
cpu_place
,
n_cpu_data
,
place
,
start
.
data
<
T
>
(),
sizeof
(
T
)
*
start
.
numel
());
T
start_value
=
n_cpu_data
[
0
];
paddle
::
memory
::
Copy
(
cpu_place
,
n_cpu_data
,
place
,
end
.
data
<
T
>
(),
sizeof
(
T
)
*
end
.
numel
());
T
end_value
=
n_cpu_data
[
0
];
paddle
::
memory
::
Copy
(
cpu_place
,
n_cpu_data
,
place
,
step
.
data
<
T
>
(),
sizeof
(
T
)
*
step
.
numel
());
T
step_value
=
n_cpu_data
[
0
];
T
start_value
=
GetValue
<
T
,
Context
>
(
dev_ctx
,
start
);
T
end_value
=
GetValue
<
T
,
Context
>
(
dev_ctx
,
end
);
T
step_value
=
GetValue
<
T
,
Context
>
(
dev_ctx
,
step
);
int64_t
size
=
0
;
phi
::
funcs
::
GetSize
(
start_value
,
end_value
,
step_value
,
&
size
);
...
...
@@ -50,7 +52,9 @@ void ArangeKernel(const Context& dev_ctx,
DenseTensor
out_cpu
;
out_cpu
.
Resize
({
out
->
numel
()});
T
*
out_cpu_data
=
dev_ctx
.
template
HostAlloc
<
T
>(
&
out_cpu
);
dev_ctx
.
template
HostAlloc
<
T
>(
&
out_cpu
);
T
*
out_cpu_data
=
out_cpu
.
data
<
T
>
();
T
value
=
start_value
;
for
(
int64_t
i
=
0
;
i
<
size
;
++
i
)
{
out_cpu_data
[
i
]
=
value
;
...
...
@@ -63,4 +67,8 @@ void ArangeKernel(const Context& dev_ctx,
}
// namespace phi
PD_REGISTER_KERNEL
(
arange
,
XPU
,
ALL_LAYOUT
,
phi
::
ArangeKernel
,
float
,
double
,
int
,
int64_t
)
{}
arange
,
XPU
,
ALL_LAYOUT
,
phi
::
ArangeKernel
,
float
,
double
,
int
,
int64_t
)
{
kernel
->
InputAt
(
0
).
SetBackend
(
phi
::
Backend
::
ALL_BACKEND
);
kernel
->
InputAt
(
1
).
SetBackend
(
phi
::
Backend
::
ALL_BACKEND
);
kernel
->
InputAt
(
2
).
SetBackend
(
phi
::
Backend
::
ALL_BACKEND
);
}
paddle/phi/kernels/xpu/gaussian_random_kernel.cc
浏览文件 @
20d168d9
...
...
@@ -42,7 +42,7 @@ void GaussianRandomKernel(const Context& ctx,
for
(
int64_t
i
=
0
;
i
<
size
;
++
i
)
{
data_cpu
[
i
]
=
dist
(
*
engine
);
}
paddle
::
memory
::
Copy
(
phi
::
XPU
Place
(),
paddle
::
memory
::
Copy
(
ctx
.
Get
Place
(),
data
,
phi
::
CPUPlace
(),
reinterpret_cast
<
void
*>
(
data_cpu
.
get
()),
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录