Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PARL
提交
57dac0d5
P
PARL
项目概览
PaddlePaddle
/
PARL
通知
67
Star
3
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
18
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PARL
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
18
Issue
18
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
57dac0d5
编写于
9月 04, 2020
作者:
B
Bo Zhou
提交者:
GitHub
9月 04, 2020
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update README.cn.md
上级
ed0bf0e9
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
3 addition
and
3 deletion
+3
-3
README.cn.md
README.cn.md
+3
-3
未找到文件。
README.cn.md
浏览文件 @
57dac0d5
...
...
@@ -21,13 +21,13 @@
PARL的目标是构建一个可以完成复杂任务的智能体。以下是用户在逐步构建一个智能体的过程中需要了解到的结构:
### Model
`Model`
用来定义前向
(
`Forward`
)网络,这通常是一个策略网络(
`Policy Network`
)或者一个值函数网络(
`Value Function`
),输入是当前环境状态
(
`State`
)。
`Model`
用来定义前向
(
`Forward`
)网络,这通常是一个策略网络 (
`Policy Network`
)或者一个值函数网络 (
`Value Function`
),输入是当前环境状态
(
`State`
)。
### Algorithm
`Algorithm`
定义了具体的算法来更新前向网络(
`Model`
),也就是通过定义损失函数来更新
`Model`
。一个
`Algorithm`
包含至少一个
`Model`
。
`Algorithm`
定义了具体的算法来更新前向网络
(
`Model`
),也就是通过定义损失函数来更新
`Model`
。一个
`Algorithm`
包含至少一个
`Model`
。
### Agent
`Agent`
负责算法与环境的交互,在交互过程中把生成的数据提供给
`Algorithm`
来更新模型(
`Model`
),数据的预处理流程也一般定义在这里。
`Agent`
负责算法与环境的交互,在交互过程中把生成的数据提供给
`Algorithm`
来更新模型
(
`Model`
),数据的预处理流程也一般定义在这里。
提示: 请访问
[
教程
](
https://parl.readthedocs.io/en/latest/getting_started.html
)
and
[
API 文档
](
https://parl.readthedocs.io/en/latest/model.html
)
以获取更多关于基础类的信息。
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录