Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
Paddle
提交
451756fb
P
Paddle
项目概览
BaiXuePrincess
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
451756fb
编写于
1月 10, 2023
作者:
W
wuhuachaocoding
提交者:
GitHub
1月 10, 2023
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
support cpu offload for stage3 (#49196)
上级
a36c5490
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
9 addition
and
5 deletion
+9
-5
python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage3.py
...uted/fleet/meta_parallel/sharding/group_sharded_stage3.py
+5
-4
python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage3_offload.py
.../collective/fleet/dygraph_group_sharded_stage3_offload.py
+4
-1
未找到文件。
python/paddle/distributed/fleet/meta_parallel/sharding/group_sharded_stage3.py
浏览文件 @
451756fb
...
@@ -428,6 +428,7 @@ class GroupShardedStage3(nn.Layer):
...
@@ -428,6 +428,7 @@ class GroupShardedStage3(nn.Layer):
place
=
core
.
CPUPlace
(),
place
=
core
.
CPUPlace
(),
name
=
"slice@"
+
param
.
name
,
name
=
"slice@"
+
param
.
name
,
)
)
if
param
.
trainable
:
with
device_guard
():
with
device_guard
():
param
.
master_weight
=
paddle
.
cast
(
param
.
master_weight
=
paddle
.
cast
(
param
.
fw_storage
,
Type
.
fp32
.
value
param
.
fw_storage
,
Type
.
fp32
.
value
...
...
python/paddle/fluid/tests/unittests/collective/fleet/dygraph_group_sharded_stage3_offload.py
浏览文件 @
451756fb
...
@@ -40,6 +40,9 @@ class MLP(fluid.Layer):
...
@@ -40,6 +40,9 @@ class MLP(fluid.Layer):
self
.
_linear1
=
Linear
(
linear_size
,
linear_size
)
self
.
_linear1
=
Linear
(
linear_size
,
linear_size
)
self
.
_linear2
=
Linear
(
linear_size
,
linear_size
)
self
.
_linear2
=
Linear
(
linear_size
,
linear_size
)
# test for trainable & untrainable offload
self
.
_linear2
.
weight
.
stop_gradient
=
False
self
.
_linear2
.
bias
.
stop_gradient
=
False
self
.
_linear3
=
Linear
(
linear_size
,
10
)
self
.
_linear3
=
Linear
(
linear_size
,
10
)
def
forward
(
self
,
inputs
):
def
forward
(
self
,
inputs
):
...
@@ -119,7 +122,7 @@ def train_mlp(
...
@@ -119,7 +122,7 @@ def train_mlp(
img
,
label
=
data
img
,
label
=
data
label
.
stop_gradient
=
True
label
.
stop_gradient
=
True
img
.
stop_gradient
=
True
img
.
stop_gradient
=
True
with
paddle
.
amp
.
auto_cast
(
True
,
level
=
'O2'
):
with
paddle
.
amp
.
auto_cast
(
use_pure_fp16
,
level
=
'O2'
):
out
=
model
(
img
)
out
=
model
(
img
)
loss
=
paddle
.
nn
.
functional
.
cross_entropy
(
loss
=
paddle
.
nn
.
functional
.
cross_entropy
(
input
=
out
,
label
=
label
input
=
out
,
label
=
label
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录