readme.md 1.5 KB
Newer Older
T
tangwei 已提交
1 2 3 4 5
# 快速开始

## 环境准备
Fleet-Rec是基于飞桨分布式训练所开发的,包含模型、训练模式的快速开发、调试、部署的工具, 让用户更轻松的使用飞桨分布式训练。

T
tangwei 已提交
6 7 8 9 10 11 12 13
- 安装方法一<PIP源直接安装>
```bash
python -m pip install fleet-rec
```

- 安装方法二

* 安装飞桨  **注:需要用户安装最新版本的飞桨<当前只支持Linux系统>。**
T
tangwei 已提交
14 15 16 17 18

```bash
python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
```

T
tangwei 已提交
19
* 源码安装Fleet-Rec
T
tangwei 已提交
20 21 22 23 24 25 26

```
git clone https://github.com/seiriosPlus/FleetRec/
cd FleetRec
python setup.py install
```

T
tangwei 已提交
27

T
tangwei 已提交
28
## ctr-dnn示例使用
29
目前框架内置了多个模型,简单的命令即可使用内置模型开始单机训练和本地1*1模拟训练
T
tangwei 已提交
30 31 32 33 34 35

### 单机训练
```bash
cd FleetRec

python -m fleetrec.run \
36
       -m fleetrec.models.rank.dnn \
T
tangwei 已提交
37
       -d cpu \
T
tangwei 已提交
38
       -e single 
T
tangwei 已提交
39 40 41

# 使用GPU资源进行训练
python -m fleetrec.run \
42
       -m fleetrec.models.rank.dnn \
T
tangwei 已提交
43 44
       -d gpu \
       -e single
T
tangwei 已提交
45 46 47 48 49 50
```

### 本地模拟分布式训练

```bash
cd FleetRec
T
tangwei 已提交
51
# 使用CPU资源进行训练
T
tangwei 已提交
52
python -m fleetrec.run \
53
       -m fleetrec.models.rank.dnn \
T
tangwei 已提交
54 55
       -d cpu \
       -e local_cluster
T
tangwei 已提交
56 57 58 59 60 61 62 63
```

### 集群提交分布式训练<需要用户预先配置好集群环境,本提交命令不包含提交客户端>

```bash
cd FleetRec

python -m fleetrec.run \
64
       -m fleetrec.models.rank.dnn \
T
tangwei 已提交
65
       -d cpu \
T
tangwei 已提交
66
       -e cluster
T
tangwei 已提交
67 68
```

T
tangwei 已提交
69

T
tangwei 已提交
70
更多用户文档及二次开发文档,敬请期待。