fix bug of ddqn (#353)

942e570c · zenghsh3 · GitHub · 779b5d4e · 942e570c
显示空白变更内容
内联并排

Showing with 1 addition and 1 deletion

parl/algorithms/fluid/ddqn.py parl/algorithms/fluid/ddqn.py +1 -1

未找到文件。
--- a/parl/algorithms/fluid/ddqn.py
+++ b/parl/algorithms/fluid/ddqn.py
@@ -75,7 +75,7 @@ class DDQN(Algorithm):
        greedy_action = layers.argmax(next_action_value, axis=-1)
        # calculate the target q value with target network
-        batch_size = layers.cast(layers.shape(greedy_action)[0], dtype='int32')
+        batch_size = layers.cast(layers.shape(greedy_action)[0], dtype='int64')
        range_tmp = layers.range(
            start=0, end=batch_size, step=1, dtype='int64') * self.act_dim
        a_indices = range_tmp + greedy_action