10.md 139 字节
Newer Older
X
updated  
xiaowei_xing 已提交
1 2 3 4 5
# Lecture 10 Advanced Policy Gradient

# 课时10 高级策略梯度 2019.02.11

## 1. 策略梯度的目标(Policy Gradient Objective)