Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
stanford-cs234-notes-zh
提交
a3c9d007
S
stanford-cs234-notes-zh
项目概览
OpenDocCN
/
stanford-cs234-notes-zh
通知
8
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
S
stanford-cs234-notes-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
GitCode(gitcode.net)2024年7月9日维护升级公告
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
a3c9d007
编写于
11月 08, 2019
作者:
X
xiaowei_xing
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
updated
上级
a87aaead
变更
8
隐藏空白更改
内联
并排
Showing
8 changed file
with
12 addition
and
7 deletion
+12
-7
docs/1.md
docs/1.md
+1
-1
docs/10.md
docs/10.md
+5
-0
docs/3.md
docs/3.md
+1
-1
docs/4.md
docs/4.md
+1
-1
docs/5.md
docs/5.md
+1
-1
docs/6.md
docs/6.md
+1
-1
docs/7.md
docs/7.md
+1
-1
docs/8&9.md
docs/8&9.md
+1
-1
未找到文件。
docs/1.md
浏览文件 @
a3c9d007
# Lecture 1 Introduction to Reinforcement Learning
# 课时1 强化学习介绍 201
8.03.20
# 课时1 强化学习介绍 201
9.01.07
## 1. 引言
...
...
docs/10.md
0 → 100644
浏览文件 @
a3c9d007
# Lecture 10 Advanced Policy Gradient
# 课时10 高级策略梯度 2019.02.11
## 1. 策略梯度的目标(Policy Gradient Objective)
\ No newline at end of file
docs/3.md
浏览文件 @
a3c9d007
# Lecture 3 Model Free Policy Evaluation: Policy Evaluation Without Knowing How the World Works
# 课时3 无模型策略评估 201
8.03.20
# 课时3 无模型策略评估 201
9.01.14
## 4. 无模型策略评估
...
...
docs/4.md
浏览文件 @
a3c9d007
# Lecture 4 Model Free Control
# 课时4 无模型控制 201
8.03.20
# 课时4 无模型控制 201
9.01.16
## 5. 无模型控制(Model Free Control)
...
...
docs/5.md
浏览文件 @
a3c9d007
# Lecture 5 Value Function Approximation
# 课时4 值函数近似 201
8.03.20
# 课时4 值函数近似 201
9.01.23
## 7. 介绍(Introduction)
...
...
docs/6.md
浏览文件 @
a3c9d007
# Lecture 6 CNNs and Deep Q-learning
# 课时6 卷积神经网络与深度 Q-学习 201
8.03.20
# 课时6 卷积神经网络与深度 Q-学习 201
9.01.28
## 7. 基于值的深度强化学习(Value-based Deep Reinforcement Learning)
...
...
docs/7.md
浏览文件 @
a3c9d007
# Lecture 7 Imitation Learning
# 课时7 模仿学习 201
8.03.2
0
# 课时7 模仿学习 201
9.01.3
0
## 8. 介绍(Introduction)
...
...
docs/8&9.md
浏览文件 @
a3c9d007
# Lecture 8&9 Policy Gradient
# 课时8&9 策略梯度 201
8.03.20
# 课时8&9 策略梯度 201
9.02.04 & 2019.02.06
## 1. 策略搜索介绍(Introduction to Policy Search)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录