readme.md 1.3 KB
Newer Older
T
tangwei 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
# 快速开始

## 环境准备
Fleet-Rec是基于飞桨分布式训练所开发的,包含模型、训练模式的快速开发、调试、部署的工具, 让用户更轻松的使用飞桨分布式训练。

- 安装飞桨  **注:需要用户安装最新版本的飞桨<当前只支持Linux系统>。**

```bash
python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
```

- 安装Fleet-Rec

```
git clone https://github.com/seiriosPlus/FleetRec/
cd FleetRec
python setup.py install
```

## ctr-dnn示例使用
目前框架内置了ctr-dnn模型,后续会加入更多模型

示例代码位于FleetRec/fleetrec/example/下, 当前支持单机训练和本地1*1模拟训练

### 单机训练
```bash
cd FleetRec

python -m fleetrec.run \
T
tangwei 已提交
30
       -m fleetrec/examples/ctr-dnn_train.yaml \
T
tangwei 已提交
31
       -e single 
T
tangwei 已提交
32 33 34 35 36 37 38 39
```

### 本地模拟分布式训练

```bash
cd FleetRec

python -m fleetrec.run \
T
tangwei 已提交
40
       -m fleetrec/examples/ctr-dnn_train.yaml \
T
tangwei 已提交
41
       -e local_cluster 
T
tangwei 已提交
42 43 44 45 46 47 48 49 50
```

### 集群提交分布式训练<需要用户预先配置好集群环境,本提交命令不包含提交客户端>

```bash
cd FleetRec

python -m fleetrec.run \
       -m fleetrec/examples/ctr-dnn_train.yaml \
T
tangwei 已提交
51
       -e cluster
T
tangwei 已提交
52 53 54
```

更多用户文档及二次开发文档,敬请期待。