Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
hands-on-ml-zh
提交
75da52fa
H
hands-on-ml-zh
项目概览
OpenDocCN
/
hands-on-ml-zh
通知
13
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
H
hands-on-ml-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
75da52fa
编写于
2月 15, 2019
作者:
Q
qiwihui
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix(集成学习和随机森林): 修正两处书写错误
上级
f31acdfa
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
2 addition
and
2 deletion
+2
-2
docs/7.集成学习和随机森林.md
docs/7.集成学习和随机森林.md
+2
-2
未找到文件。
docs/7.集成学习和随机森林.md
浏览文件 @
75da52fa
...
...
@@ -306,7 +306,7 @@ sklearn 通常使用 Adaboost 的多分类版本 *SAMME*(这就代表了 *分
![
图7-10
](
../images/chapter_7/7-10.png
)
为了找到树的最优数量,你可以使用早停技术(第四章讨论)。最简单使用这个技术的方法就是使用
`staged_predict()`
:它在训练的每个阶段(用一棵树,两棵树等)返回一个迭代器。
加
下来的代码用 120 个树训练了一个 GBRT 集成,然后在训练的每个阶段验证错误以找到树的最佳数量,最后使用 GBRT 树的最优数量训练另一个集成:
为了找到树的最优数量,你可以使用早停技术(第四章讨论)。最简单使用这个技术的方法就是使用
`staged_predict()`
:它在训练的每个阶段(用一棵树,两棵树等)返回一个迭代器。
接
下来的代码用 120 个树训练了一个 GBRT 集成,然后在训练的每个阶段验证错误以找到树的最佳数量,最后使用 GBRT 树的最优数量训练另一个集成:
```
python
>>>
import
numpy
as
np
...
...
@@ -361,7 +361,7 @@ for n_estimators in range(1, 120):
![
图7-13
](
../images/chapter_7/7-13.png
)
接下来,第一层的分类器被用来预测第二个子集(保持集)(详见 7-14)。这确保了预测结果很“干净”,因为这些分类器在训练的时候没有使用过这些
事
例。现在对在保持集中的每一个实例都有三个预测值。我们现在可以使用这些预测结果作为输入特征来创建一个新的训练集(这使得这个训练集是三维的),并且保持目标数值不变。随后
*blender*
在这个新的训练集上训练,因此,它学会了预测第一层预测的目标值。
接下来,第一层的分类器被用来预测第二个子集(保持集)(详见 7-14)。这确保了预测结果很“干净”,因为这些分类器在训练的时候没有使用过这些
实
例。现在对在保持集中的每一个实例都有三个预测值。我们现在可以使用这些预测结果作为输入特征来创建一个新的训练集(这使得这个训练集是三维的),并且保持目标数值不变。随后
*blender*
在这个新的训练集上训练,因此,它学会了预测第一层预测的目标值。
![
图7-14
](
../images/chapter_7/7-14.png
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录