test

ffa2a342 · xiaowei_xing · 4fe29875 · ffa2a342
隐藏空白更改
内联并排

Showing with 3 addition and 3 deletion

docs/10.md docs/10.md +3 -3

未找到文件。
--- a/docs/10.md
+++ b/docs/10.md
@@ -554,6 +554,6 @@ $$

 **练习 6.7** 这里是对离散动作空间使用自动微分来执行最大似然估计的伪代码。

-$$
-{\tt logits = policy.predictions(states)}
-$$
\ No newline at end of file
+${\tt logits = policy.predictions(states)}$
+
+${\tt negative_likelihoods = tf.nn.softmax_cross_entropy_with_logits(}$
\ No newline at end of file