PaddlePaddle / Paddle
大约 2 年前同步成功

20933

代码
- 文件
- 提交
- 分支
- Tags
- 贡献者
- 分支图
- Diff
Issue 1423
- 列表
- 看板
- 标记
- 里程碑
合并请求 543
Wiki 0
- Wiki
分析
- 仓库
- DevOps
项目成员
Pages

Apply advantage function for reinforcement learning

Created by: reyoung

Users want to use Paddle for reinforcement learning. For RL, the advantage function should be applied for gradient or optimizer. We should let users write training for-loop to complete this feature.

https://hackmit-baidu.slack.com/archives/C727D998C/p1505585517000037

PaddlePaddle / Paddle 大约 2 年 前同步成功

Apply advantage function for reinforcement learning

PaddlePaddle / Paddle
大约 2 年前同步成功