index_cn.rst 1.2 KB
Newer Older
G
init  
gongweibao 已提交
1
集群训练
2
================
G
init  
gongweibao 已提交
3
用户的集群环境不尽相同,为了方便大家的部署,我们提供了多种的集群部署方式,方便提交集群训练任务,以下将一一介绍:
4

G
init  
gongweibao 已提交
5
`Kubernetes <http://kubernetes.io>`_ 是Google开源的容器集群的调度框架,支持大规模集群生产环境的完整集群方案。以下指南展示了PaddlePaddle对Kubernetes的支持:
6

G
gongweibao 已提交
7 8 9 10 11
..  toctree::
  :maxdepth: 1

  k8s_cn.md
  k8s_distributed_cn.md
G
init  
gongweibao 已提交
12 13 14

`OpenMPI <https://www.open-mpi.org>`_  是成熟的高性能并行计算框架,在HPC领域使用非常的广泛。以下指南介绍了如何使用OpenMPI来搭建PaddlePaddle的集群训练任务:

G
gongweibao 已提交
15 16
..  toctree::
  :maxdepth: 1
G
init  
gongweibao 已提交
17

G
gongweibao 已提交
18
  openmpi_cn.md
G
init  
gongweibao 已提交
19

G
gongweibao 已提交
20
`Fabric <http://www.fabfile.org>`_ 是一个方便的程序部署和管理工具。我们提供了使用Fabric 进行部署、管理的方法,如果想详细了解,请阅读以下指南:
G
init  
gongweibao 已提交
21

G
gongweibao 已提交
22 23
..  toctree::
  :maxdepth: 1
G
init  
gongweibao 已提交
24

G
gongweibao 已提交
25
  fabric_cn.md
26

G
gongweibao 已提交
27
我们也支持在AWS上部署PaddlePaddle,详细请了解:
28 29 30 31 32

..  toctree::
  :maxdepth: 1

  k8s_aws_cn.md
G
gongweibao 已提交
33 34 35

您可以在 `cluster_train_v2 <https://github.com/PaddlePaddle/Paddle/tree/develop/paddle/scripts/cluster_train_v2>`_ 找到以上相关的例子。