提交 f27a3062 编写于 作者: A Aston Zhang

model sel

上级 1cb95858
# 欠拟合、过拟合和选择模型
# 欠拟合、过拟合和模型选择
在前几节基于Fashion-MNIST数据集的实验中,我们评价了机器学习模型在训练数据集和测试数据集上的表现。如果你动手改变过实验中的模型结构或者超参数的话,你也许发现了:当模型在训练数据集上更准确时,在测试数据集上的准确率既可能上升又可能下降。这是为什么呢?
......@@ -158,11 +158,11 @@ fit_and_plot(poly_features[0:2, :], poly_features[n_train:, :], labels[0:2],
我们将在后面的章节继续讨论过拟合问题以及应对过拟合的方法,例如正则化和丢弃法。
## 选择模型
## 模型选择
我们已经知道,训练误差无法被用来估计泛化误差。那我们是否可以根据测试数据集上的误差来调节超参数和选择模型呢?答案是否定的。原因很简单:为降低测试数据集误差而修改模型将使本节开始的“独立同分布假设”不再成立。此时测试数据集的误差无法正确反映泛化误差。
为了选择模型,我们可以切分原始训练数据集:其中大部分样本组成新的训练数据集,剩下的组成验证数据集(validation data set)。我们在新的训练数据集上训练模型,并根据模型在验证数据集上的表现调参和选择模型。最后,我们在测试数据集上评价模型的表现。
在选择模型时,我们可以切分原始训练数据集:其中大部分样本组成新的训练数据集,剩下的组成验证数据集(validation data set)。我们在新的训练数据集上训练模型,并根据模型在验证数据集上的表现调参和选择模型。最后,我们在测试数据集上评价模型的表现。
### $K$ 折交叉验证
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册