Overview.md 4.8 KB
Newer Older
T
TomorrowIsAnOtherDay 已提交
1
<p align="center">
T
TomorrowIsAnOtherDay 已提交
2 3
<img src="../../.github/PARL-logo.png" width="500"/>
<img src="../images/bar.png"/>
T
TomorrowIsAnOtherDay 已提交
4 5
</p>

T
TomorrowIsAnOtherDay 已提交
6
<br>**PARL**是一个主打高性能、稳定复现、轻量级的强化学习框架。<br>
T
TomorrowIsAnOtherDay 已提交
7

T
TomorrowIsAnOtherDay 已提交
8 9 10 11 12 13 14 15

## 使用场景
- 想要在**自己的环境**中尝试使用强化学习解决问题
- 想快速调研下**不同强化学习算法**在同一个问题上的效果
- 强化学习算法训练速度太慢,想搭建**分布式**强化学习训练平台
- python的GIL全局锁限制了多线程加速,想**加速python代码**


T
TomorrowIsAnOtherDay 已提交
16
## PARL文档全览
T
TomorrowIsAnOtherDay 已提交
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
<table>
  <tbody>
    <tr align="center" valign="bottom">
    <td>
      </td>
      <td>
        <b>构建智能体(基础)</b>
        <img src="../images/bar.png"/>
      </td>
      <td>
        <b>开源算法库</b>
        <img src="../images/bar.png"/>
      </td>
      <td>
        <b>并行训练(进阶)</b>
        <img src="../images/bar.png"/>
      </td>
    </tr>
    </tr>
    <tr valign="top">
    <td align="center" valign="middle">
      </td>
      <td>
T
TomorrowIsAnOtherDay 已提交
40
        <ul>
T
TomorrowIsAnOtherDay 已提交
41
        <li><b>教程</b></li>
T
TomorrowIsAnOtherDay 已提交
42 43
           <ul>
          <li><a href="tutorial/quick_start.md#quick_start">入门:解决cartpole问题</a></li>
T
TomorrowIsAnOtherDay 已提交
44 45 46
          <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#BOHB">智能体(Agent)搭建示例</a></li>
          <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#BOHB">保存模型和加载模型</a></li>
          <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#BOHB">绘制训练曲线</a></li>
T
TomorrowIsAnOtherDay 已提交
47
           </ul>
T
TomorrowIsAnOtherDay 已提交
48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78
        </ul>
      </td>
      <td align="left" >
        <ul>
          <li><b>前沿算法</b></li>
            <ul>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#BOHB">MADDPG</a></li>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#TPE">ES</a></li>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#TPE">SAC</a></li>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#TPE">TD3</a></li>
            </ul>
          <li><b>经典算法</b></li>
            <ul>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#BOHB">PolicyGradient</a></li>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#TPE">DQN</a></li>
            <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#SMAC">DDPG</a></li>
            <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#MetisTuner">PPO</a></li>
            </ul>
          <li><b>并行算法</b></li>
            <ul>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#BOHB">A2C</a></li>
              <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#TPE">GA3C</a></li>
            <li><a href="docs/zh_CN/Tuner/BuiltinTuner.md#SMAC">IMPALA</a></li>
            </ul>
        </ul>
      </td>
      <td>
      <ul>
        <li><b>教程</b></li>
            <ul><li><a href="docs/zh_CN/TrainingService/PaiMode.md">部署集群</a></li>
            <li><a href="docs/zh_CN/TrainingService/KubeflowMode.md">入门教程</a></li>
T
TomorrowIsAnOtherDay 已提交
79 80 81
            <li><a href="docs/zh_CN/TrainingService/.md">加速案例</a></li>
            <li><a href="docs/zh_CN/TrainingService/.md">集群信息监控</a></li>
            <li><a href="docs/zh_CN/TrainingService/.md">如何debug</a></li>
T
TomorrowIsAnOtherDay 已提交
82 83 84 85
            </ul>
      </td>
    </tr>
  </tbody>
T
TomorrowIsAnOtherDay 已提交
86
  
T
TomorrowIsAnOtherDay 已提交
87
</table>
T
TomorrowIsAnOtherDay 已提交
88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

## **安装**

### **安装**
PARL 支持并在 Ubuntu >= 16.04, macOS >= 10.14.1, 和 Windows 10通过了测试。 目前在Windows上**仅支持**python3.5+以上的版本,要求是64位的python。

```shell
pip install parl --upgrade
```
如果遇到网络问题导致的下载较慢,建议使用清华源解决:
```shell
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple parl --upgrade
```

如果想试试最新代码,可从源代码安装 NNI。
```shell
git clone https://github.com/PaddlePaddle/PARL
cd PARL
pip install .
```
T
TomorrowIsAnOtherDay 已提交
108 109
如果遇到网络问题导致的下载较慢,建议使用清华源解决(参考上面的命令)。<br>
遇到git clone如果较慢的问题,建议使用我们托管在国内码云平台的仓库。
T
TomorrowIsAnOtherDay 已提交
110 111 112 113 114 115
```shell
git clone https://gitee.com/paddlepaddle/PARL.git
```

### **关于并行**

T
TomorrowIsAnOtherDay 已提交
116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133
如果只是想使用PARL的并行功能的话,是无需安装任何深度学习框架的。


## 贡献
本项目欢迎任何贡献和建议。 大多数贡献都需要你同意参与者许可协议(CLA),来声明你有权,并实际上授予我们有权使用你的贡献。
### 代码贡献规范
- 代码风格规范<br>
PARL使用yapf工具进行代码风格的统一,使用方法如下:
```shell
pip install yapf==0.24.0
yapf -i modified_file.py
```
- 持续继承测试<br>
当增加代码时候,需要增加测试代码覆盖所添加的代码,测试代码得放在相关代码文件的`tests`文件夹下,以`_test.py`结尾(这样持续集成测试会自动拉取代码跑)。附:[测试代码示例](../../parl/tests/import_test.py)


## 反馈
- 在 GitHub 上[提交问题](https://github.com/PaddlePaddle/PARL/issues)