Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MindSpore
docs
提交
a409f542
D
docs
项目概览
MindSpore
/
docs
通知
4
Star
2
Fork
2
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
docs
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
a409f542
编写于
8月 28, 2020
作者:
Z
Ziyan
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add recursive programming
上级
8ab19ea1
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
2 addition
and
2 deletion
+2
-2
docs/source_zh_cn/design/mindspore/distributed_training_design.md
...rce_zh_cn/design/mindspore/distributed_training_design.md
+2
-2
docs/source_zh_cn/design/mindspore/images/auto_parallel.png
docs/source_zh_cn/design/mindspore/images/auto_parallel.png
+0
-0
docs/source_zh_cn/design/mindspore/images/auto_parallel_design.png
...ce_zh_cn/design/mindspore/images/auto_parallel_design.png
+0
-0
未找到文件。
docs/source_zh_cn/design/mindspore/distributed_training_design.md
浏览文件 @
a409f542
...
...
@@ -81,7 +81,7 @@
### 自动并行原理
![
自动并行图解
](
./images/auto_parallel.png
)
![
自动并行图解
](
./images/auto_parallel
_design
.png
)
1.
通用的张量排布模型
...
...
@@ -98,7 +98,7 @@
2.
高效的并行策略搜索算法
当用户熟悉了算子的切分表达,并手动对算子配置切分策略,这就是`SEMI_AUTO_PARALLEL`半自动并行模式。这种方式对手动调优有帮助,但还是具有一定的调试难度,用户需要掌握并行原理,并根据网络结构、集群拓扑等计算分析得到高性能的并行方案。为了进一步帮助用户加速并行网络训练过程,在半自动并行模式的基础上,`AUTO_PARALLEL`自动并行模式引入了并行切分策略自动搜索的特性。自动并行围绕硬件平台构建相应的代价函数模型(Cost Model),计算出一定数据量、一定算子在不同切分策略下的计算开销(Computation Cost),内存开销(Memory Cost)及通信开销(Communication Cost)。然后通过动态规划算法(Dynamic Programming),以单卡的内存上限为约束条件,高效地搜索出性能较优的切分策略。
当用户熟悉了算子的切分表达,并手动对算子配置切分策略,这就是`SEMI_AUTO_PARALLEL`半自动并行模式。这种方式对手动调优有帮助,但还是具有一定的调试难度,用户需要掌握并行原理,并根据网络结构、集群拓扑等计算分析得到高性能的并行方案。为了进一步帮助用户加速并行网络训练过程,在半自动并行模式的基础上,`AUTO_PARALLEL`自动并行模式引入了并行切分策略自动搜索的特性。自动并行围绕硬件平台构建相应的代价函数模型(Cost Model),计算出一定数据量、一定算子在不同切分策略下的计算开销(Computation Cost),内存开销(Memory Cost)及通信开销(Communication Cost)。然后通过动态规划算法(Dynamic Programming)
或者递归规划算法(Recursive Programming)
,以单卡的内存上限为约束条件,高效地搜索出性能较优的切分策略。
策略搜索这一步骤代替了用户手动指定模型切分,在短时间内可以得到较高性能的切分方案,极大降低了并行训练的使用门槛。
...
...
docs/source_zh_cn/design/mindspore/images/auto_parallel.png
已删除
100644 → 0
浏览文件 @
8ab19ea1
47.7 KB
docs/source_zh_cn/design/mindspore/images/auto_parallel_design.png
0 → 100644
浏览文件 @
a409f542
56.1 KB
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录