提交 75da52fa 编写于 作者: Q qiwihui

fix(集成学习和随机森林): 修正两处书写错误

上级 f31acdfa
......@@ -306,7 +306,7 @@ sklearn 通常使用 Adaboost 的多分类版本 *SAMME*(这就代表了 *分
![图7-10](../images/chapter_7/7-10.png)
为了找到树的最优数量,你可以使用早停技术(第四章讨论)。最简单使用这个技术的方法就是使用`staged_predict()`:它在训练的每个阶段(用一棵树,两棵树等)返回一个迭代器。下来的代码用 120 个树训练了一个 GBRT 集成,然后在训练的每个阶段验证错误以找到树的最佳数量,最后使用 GBRT 树的最优数量训练另一个集成:
为了找到树的最优数量,你可以使用早停技术(第四章讨论)。最简单使用这个技术的方法就是使用`staged_predict()`:它在训练的每个阶段(用一棵树,两棵树等)返回一个迭代器。下来的代码用 120 个树训练了一个 GBRT 集成,然后在训练的每个阶段验证错误以找到树的最佳数量,最后使用 GBRT 树的最优数量训练另一个集成:
```python
>>>import numpy as np
......@@ -361,7 +361,7 @@ for n_estimators in range(1, 120):
![图7-13](../images/chapter_7/7-13.png)
接下来,第一层的分类器被用来预测第二个子集(保持集)(详见 7-14)。这确保了预测结果很“干净”,因为这些分类器在训练的时候没有使用过这些例。现在对在保持集中的每一个实例都有三个预测值。我们现在可以使用这些预测结果作为输入特征来创建一个新的训练集(这使得这个训练集是三维的),并且保持目标数值不变。随后 *blender* 在这个新的训练集上训练,因此,它学会了预测第一层预测的目标值。
接下来,第一层的分类器被用来预测第二个子集(保持集)(详见 7-14)。这确保了预测结果很“干净”,因为这些分类器在训练的时候没有使用过这些例。现在对在保持集中的每一个实例都有三个预测值。我们现在可以使用这些预测结果作为输入特征来创建一个新的训练集(这使得这个训练集是三维的),并且保持目标数值不变。随后 *blender* 在这个新的训练集上训练,因此,它学会了预测第一层预测的目标值。
![图7-14](../images/chapter_7/7-14.png)
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册