# LiftSim基线

## 简介

基于PARL库实现A2C算法，应用于[RLSchool][rlschool]库中的电梯调度模拟环境[LiftSim][liftsim]。

## 依赖库

+ [paddlepaddle>=1.6.1](https://github.com/PaddlePaddle/Paddle)
+ [parl>=1.2.2](https://github.com/PaddlePaddle/PARL)
+ [rlschool>=0.1.1][rlschool]


## 分布式训练

首先，启动一个具有5个CPU资源的本地集群：

```bash
xparl start --port 8010 --cpu_num 5
```

> 注意，如果你已经启动了一个集群，则不需要重复运行上面命令。关于PARL集群更多信息，可以参考[文档](https://parl.readthedocs.io/en/latest/parallel_training/setup.html)。

然后我们就可以通过运行下面命令进行分布式训练：

```bash
python train.py
```


## 评估
可以通过下面命令来评估保存的模型
```bash
python evaluate.py --model_path saved_models/[FILENAME]
```

tensorboard和log文件会保存在`./train_log/train/`；可以通过运行命令`tensorboard --logdir .`查看tensorboard可视化界面。

## 收敛指标
训练30h左右，评估指标能达到-120分左右（LiftSim环境运行1天reward）
<img src="performance.png"/>

## 可视化效果
<img src="effect.gif" width="400"/>

[rlschool]: https://github.com/PaddlePaddle/RLSchool
[liftsim]: https://github.com/PaddlePaddle/RLSchool/tree/master/rlschool/liftsim