未验证 提交 b9e06b53 编写于 作者: B Bo Zhou 提交者: GitHub

Update README.md (#248)

上级 117fa5b2
......@@ -12,7 +12,7 @@ auto agent = ESAgent(config);
for (int i = 0; i < 10; ++i) {
auto sampling_agnet = agent->clone(); // clone出一个sampling agent
SamplingInfo info;
agent->add_noise(info); // 参数扰动,同时保存随机种子到info中
sampling_agent->add_noise(info); // 参数扰动,同时保存随机种子到info中
int reward = evaluate(env, sampling_agent); //评估参数
noisy_info.push_back(info); // 记录随机噪声对应种子
noisy_rewards.push_back(reward); // 记录评估结果
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册