提交 a3c9d007 编写于 作者: X xiaowei_xing

updated

上级 a87aaead
# Lecture 1 Introduction to Reinforcement Learning
# 课时1 强化学习介绍 2018.03.20
# 课时1 强化学习介绍 2019.01.07
## 1. 引言
......
# Lecture 10 Advanced Policy Gradient
# 课时10 高级策略梯度 2019.02.11
## 1. 策略梯度的目标(Policy Gradient Objective)
\ No newline at end of file
# Lecture 3 Model Free Policy Evaluation: Policy Evaluation Without Knowing How the World Works
# 课时3 无模型策略评估 2018.03.20
# 课时3 无模型策略评估 2019.01.14
## 4. 无模型策略评估
......
# Lecture 4 Model Free Control
# 课时4 无模型控制 2018.03.20
# 课时4 无模型控制 2019.01.16
## 5. 无模型控制(Model Free Control)
......
# Lecture 5 Value Function Approximation
# 课时4 值函数近似 2018.03.20
# 课时4 值函数近似 2019.01.23
## 7. 介绍(Introduction)
......
# Lecture 6 CNNs and Deep Q-learning
# 课时6 卷积神经网络与深度 Q-学习 2018.03.20
# 课时6 卷积神经网络与深度 Q-学习 2019.01.28
## 7. 基于值的深度强化学习(Value-based Deep Reinforcement Learning)
......
# Lecture 7 Imitation Learning
# 课时7 模仿学习 2018.03.20
# 课时7 模仿学习 2019.01.30
## 8. 介绍(Introduction)
......
# Lecture 8&9 Policy Gradient
# 课时8&9 策略梯度 2018.03.20
# 课时8&9 策略梯度 2019.02.04 & 2019.02.06
## 1. 策略搜索介绍(Introduction to Policy Search)
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册