hotfix(nyz): fix cartpole ppg value buffer sample typo

da19fdbd · niuyazhe · 19020398 · da19fdbd
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

dizoo/classic_control/cartpole/entry/cartpole_ppg_main.py dizoo/classic_control/cartpole/entry/cartpole_ppg_main.py +1 -1

未找到文件。
--- a/dizoo/classic_control/cartpole/entry/cartpole_ppg_main.py
+++ b/dizoo/classic_control/cartpole/entry/cartpole_ppg_main.py
@@ -66,7 +66,7 @@ def main(cfg, seed=0, max_iterations=int(1e10)):
        for i in range(cfg.policy.learn.update_per_collect):
            batch_size = learner.policy.get_attribute('batch_size')
            policy_data = policy_buffer.sample(batch_size['policy'], learner.train_iter)
-            value_data = policy_buffer.sample(batch_size['value'], learner.train_iter)
+            value_data = value_buffer.sample(batch_size['value'], learner.train_iter)
            if policy_data is not None and value_data is not None:
                train_data = {'policy': policy_data, 'value': value_data}
                learner.train(train_data, collector.envstep)