Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Greenplum
DeepSpeed
提交
5127b2fa
D
DeepSpeed
项目概览
Greenplum
/
DeepSpeed
上一次同步 大约 1 年
通知
10
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeed
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
5127b2fa
编写于
7月 12, 2021
作者:
S
Stas Bekman
提交者:
GitHub
7月 12, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
improve debug (#1215)
上级
497b741f
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
5 addition
and
4 deletion
+5
-4
deepspeed/runtime/zero/partition_parameters.py
deepspeed/runtime/zero/partition_parameters.py
+4
-3
deepspeed/runtime/zero/stage3.py
deepspeed/runtime/zero/stage3.py
+1
-1
未找到文件。
deepspeed/runtime/zero/partition_parameters.py
浏览文件 @
5127b2fa
...
...
@@ -18,7 +18,7 @@ from .offload_constants import *
from
..utils
import
see_memory_usage
from
deepspeed.utils
import
log_dist
,
init_distributed
from
deepspeed.utils.debug
import
debug_param2name_id_shape
,
debug_module2name
,
debug_param2name
,
debug_param2name_id_shape_status
,
printflock
,
log_rank_file
from
deepspeed.utils.debug
import
debug_param2name_id_shape
,
debug_
param2name_id_shape_device
,
debug_
module2name
,
debug_param2name
,
debug_param2name_id_shape_status
,
printflock
,
log_rank_file
from
..swap_tensor.partitioned_param_swapper
import
AsyncPartitionedParameterSwapper
,
PartitionedParamStatus
from
..config
import
DeepSpeedConfig
...
...
@@ -568,7 +568,7 @@ class Init(InsertPostInitMethodToModuleSubClasses):
def
partition
(
param_list
=
None
,
hierarchy
=
0
,
has_been_updated
=
False
):
cls
=
param
print_rank_0
(
f
"
{
'--'
*
hierarchy
}
----Partitioning param
with id
{
cls
.
ds_id
}
dev
{
cls
.
device
}
shape
{
cls
.
shape
}
"
f
"
{
'--'
*
hierarchy
}
----Partitioning param
{
debug_param2name_id_shape_device
(
cls
)
}
"
)
if
param_list
is
None
:
param_list
=
[
cls
]
...
...
@@ -589,7 +589,8 @@ class Init(InsertPostInitMethodToModuleSubClasses):
accumulate
=
False
):
cls
=
param
print_rank_0
(
f
"
{
'--'
*
hierarchy
}
----Partitioning param gradient with id
{
cls
.
ds_id
}
"
)
f
"
{
'--'
*
hierarchy
}
----Partitioning param gradient with id
{
debug_param2name_id_shape_device
(
cls
)
}
"
)
if
param_list
is
None
:
param_list
=
[
cls
]
if
isinstance
(
partition_buffers
,
torch
.
Tensor
):
...
...
deepspeed/runtime/zero/stage3.py
浏览文件 @
5127b2fa
...
...
@@ -2182,7 +2182,7 @@ class FP16_DeepSpeedZeroOptimizer_Stage3(object):
params_to_reduce
=
[
param
for
i
,
param
,
param_id
in
self
.
params_in_ipg_bucket
]
#print(f"Params in ipg bucket {self.params_in_ipg_bucket}")
#print(f"Reducing {[(
param.ds_id
, param.grad) for param in params_to_reduce]}")
#print(f"Reducing {[(
debug_param2name_id_shape(param)
, param.grad) for param in params_to_reduce]}")
#exit(0)
if
self
.
contiguous_gradients
:
reduction_list
=
[
self
.
ipg_buffer
[
self
.
ipg_index
]]
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录