fix(nyz): fix test ppo continuous input range bug(enable docker, smac docker)

8efee984 · niuyazhe · 993bb0e5 · 8efee984
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

ding/rl_utils/tests/test_ppo.py ding/rl_utils/tests/test_ppo.py +1 -1

未找到文件。
--- a/ding/rl_utils/tests/test_ppo.py
+++ b/ding/rl_utils/tests/test_ppo.py
@@ -70,7 +70,7 @@ def test_mappo():
 @pytest.mark.parametrize('use_value_clip, dual_clip, weight', args)
 def test_ppo_error_continous(use_value_clip, dual_clip, weight):
    B, N = 4, 6
-    mu_sigma_new = [torch.randn(B, N).requires_grad_(True), torch.randn(B, N).requires_grad_(True)]
+    mu_sigma_new = [torch.rand(B, N).requires_grad_(True), torch.rand(B, N).requires_grad_(True)]
    mu_sigma_old = [
        mu_sigma_new[0] + torch.rand_like(mu_sigma_new[0]) * 0.1,
        mu_sigma_new[1] + torch.rand_like(mu_sigma_new[1]) * 0.1