wrap code

d8ff778b · Aston Zhang · 31dd2c58 · d8ff778b · d8ff778b
隐藏空白更改
内联并排

Showing with 10 addition and 8 deletion

chapter_optimization/adadelta-scratch.md chapter_optimization/adadelta-scratch.md +2 -1

chapter_optimization/adam-gluon.md chapter_optimization/adam-gluon.md +8 -7

未找到文件。
--- a/chapter_optimization/adadelta-scratch.md
+++ b/chapter_optimization/adadelta-scratch.md
@@ -36,7 +36,8 @@ def adadelta(params, sqrs, deltas, rho, batch_size):
    for param, sqr, delta in zip(params, sqrs, deltas):
        g = param.grad / batch_size
        sqr[:] = rho * sqr + (1. - rho) * nd.square(g)
-        cur_delta = nd.sqrt(delta + eps_stable) / nd.sqrt(sqr + eps_stable) * g
+        cur_delta = (nd.sqrt(delta + eps_stable) 
+                     / nd.sqrt(sqr + eps_stable) * g)
        delta[:] = rho * delta + (1. - rho) * cur_delta * cur_delta
        param[:] -= cur_delta 
 ```

--- a/chapter_optimization/adam-gluon.md
+++ b/chapter_optimization/adam-gluon.md
@@ -54,7 +54,14 @@ utils.optimize(batch_size=10, trainer=trainer, num_epochs=3, decay_epoch=None,
 * 回顾前面几章中你感兴趣的模型，将训练部分的优化算法替换成其他算法，观察并分析实验现象。


-## 优化章节回顾
+## 讨论
+
+欢迎扫码直达[本节内容讨论区](https://discuss.gluon.ai/t/topic/2280)：
+
+![](../img/qr_adam-gluon.svg)
+
+
+## 本章回顾


 > 梯度下降可沉甸，  随机降低方差难。
@@ -73,9 +80,3 @@ utils.optimize(batch_size=10, trainer=trainer, num_epochs=3, decay_epoch=None,
 * 学率：学习率。
 * 换：这个参数被替换掉。
 * 权：指数加权移动平均。
-
-## 讨论
-
-欢迎扫码直达[本节内容讨论区](https://discuss.gluon.ai/t/topic/2280)：
-
-![](../img/qr_adam-gluon.svg)