use DataLoader in weight-decay to have similar results with weight-decay-gluon

31bfc506 · Aston Zhang · ae2a31ad · 31bfc506 · 31bfc506
Showing with 8 addition and 5 deletion

chapter_deep-learning-basics/weight-decay-gluon.md chapter_deep-learning-basics/weight-decay-gluon.md +4 -4

chapter_deep-learning-basics/weight-decay.md chapter_deep-learning-basics/weight-decay.md +4 -1

未找到文件。
--- a/chapter_deep-learning-basics/weight-decay-gluon.md
+++ b/chapter_deep-learning-basics/weight-decay-gluon.md
@@ -27,7 +27,7 @@ train_features, test_features = features[:n_train, :], features[n_train:, :]
 train_labels, test_labels = labels[:n_train], labels[n_train:]

 num_epochs = 10
-learning_rate = 0.003
+lr = 0.003
 batch_size = 1
 train_iter = gdata.DataLoader(gdata.ArrayDataset(
    train_features, train_labels), batch_size, shuffle=True)
@@ -45,10 +45,10 @@ def fit_and_plot(weight_decay):
    net.initialize(init.Normal(sigma=1))
    # 对权重参数做 L2 范数正则化，即权重衰减。
    trainer_w = gluon.Trainer(net.collect_params('.*weight'), 'sgd', {
-        'learning_rate': learning_rate, 'wd': weight_decay})
+        'learning_rate': lr, 'wd': weight_decay})
    # 不对偏差参数做 L2 范数正则化。
    trainer_b = gluon.Trainer(net.collect_params('.*bias'), 'sgd', {
-        'learning_rate': learning_rate})
+        'learning_rate': lr})
    train_ls = []
    test_ls = []
    for _ in range(num_epochs):
@@ -65,7 +65,7 @@ def fit_and_plot(weight_decay):
                            test_labels).mean().asscalar())
    gb.semilogy(range(1, num_epochs + 1), train_ls, 'epochs', 'loss',
                range(1, num_epochs + 1), test_ls, ['train', 'test'])
-    return 'w[:10]:', net[0].weight.data()[:,:10], 'b:', net[0].bias.data()
+    return 'w[:10]:', net[0].weight.data()[:, :10], 'b:', net[0].bias.data()
 ```

 ## 观察实验结果

--- a/chapter_deep-learning-basics/weight-decay.md
+++ b/chapter_deep-learning-basics/weight-decay.md
@@ -43,6 +43,7 @@ $$y = 0.05 + \sum_{i = 1}^p 0.01x_i +  \epsilon,$$
 %matplotlib inline
 import gluonbook as gb
 from mxnet import autograd, gluon, nd
+from mxnet.gluon import data as gdata

 n_train = 20
 n_test = 100
@@ -88,6 +89,8 @@ def l2_penalty(w):
 batch_size = 1
 num_epochs = 10
 lr = 0.003
+train_iter = gdata.DataLoader(gdata.ArrayDataset(
+    train_features, train_labels), batch_size, shuffle=True)

 net = gb.linreg
 loss = gb.squared_loss
@@ -99,7 +102,7 @@ def fit_and_plot(lambd):
    train_ls = []
    test_ls = []
    for _ in range(num_epochs):        
-        for X, y in gb.data_iter(batch_size, features, labels):
+        for X, y in train_iter:
            with autograd.record():
                # 添加了 L2 范数惩罚项。
                l = loss(net(X, w, b), y) + lambd * l2_penalty(w)