readme.md 1.4 KB
Newer Older
T
tangwei 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
# 快速开始

## 环境准备
Fleet-Rec是基于飞桨分布式训练所开发的,包含模型、训练模式的快速开发、调试、部署的工具, 让用户更轻松的使用飞桨分布式训练。

- 安装飞桨  **注:需要用户安装最新版本的飞桨<当前只支持Linux系统>。**

```bash
python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
```

- 安装Fleet-Rec

```
git clone https://github.com/seiriosPlus/FleetRec/
cd FleetRec
python setup.py install
```

## ctr-dnn示例使用
目前框架内置了ctr-dnn模型,后续会加入更多模型

示例代码位于FleetRec/fleetrec/example/下, 当前支持单机训练和本地1*1模拟训练

### 单机训练
```bash
cd FleetRec

python -m fleetrec.run \
T
tangwei 已提交
30 31 32
       -m fleetrec/examples/ctr-dnn_train.yaml \
       -e single \
       -ex fleetrec/examples/runtime.yaml
T
tangwei 已提交
33 34 35 36 37 38 39 40 41

```

### 本地模拟分布式训练

```bash
cd FleetRec

python -m fleetrec.run \
T
tangwei 已提交
42 43 44 45 46 47 48 49 50 51 52 53 54 55 56
       -m fleetrec/examples/ctr-dnn_train.yaml \
       -e local_cluster \
       -ex fleetrec/examples/runtime.yaml

```

### 集群提交分布式训练<需要用户预先配置好集群环境,本提交命令不包含提交客户端>

```bash
cd FleetRec

python -m fleetrec.run \
       -m fleetrec/examples/ctr-dnn_train.yaml \
       -e cluster \
       -ex fleetrec/examples/runtime.yaml
T
tangwei 已提交
57 58 59 60

```

更多用户文档及二次开发文档,敬请期待。