Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
data8-textbook-zh
提交
dbdfce64
D
data8-textbook-zh
项目概览
OpenDocCN
/
data8-textbook-zh
大约 1 年 前同步成功
通知
0
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
data8-textbook-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
dbdfce64
编写于
11月 18, 2017
作者:
W
wizardforcel
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
ch7.
上级
19361f9b
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
39 addition
and
1 deletion
+39
-1
7.md
7.md
+39
-1
未找到文件。
7.md
浏览文件 @
dbdfce64
...
...
@@ -375,7 +375,7 @@ close_to_68.column('Child').mean()
```
我们现在有了一种方法,给定任何数据集中的双亲身高,就可以预测子女的身高。我们可以定义一个函数
`predict_child`
来实现它
1
。 除了名称的选择之外,函数的主体由上面两个单元格中的代码组成。
我们现在有了一种方法,给定任何数据集中的双亲身高,就可以预测子女的身高。我们可以定义一个函数
`predict_child`
来实现它。 除了名称的选择之外,函数的主体由上面两个单元格中的代码组成。
```
py
def
predict_child
(
mpht
):
...
...
@@ -436,3 +436,41 @@ heights_with_predictions.scatter('MidParent')
这个例子,就像约翰·斯诺(John Snow)对霍乱死亡的分析一样,说明了现代数据科学的一些基本概念的根源可追溯到一个多世纪之前。高尔顿的方法,比如我们在这里使用的方法,是最近邻预测方法的雏形,现在在不同的环境中有着有效的应用。机器学习的现代领域包括这些方法的自动化,来基于庞大且快速发展的数据集进行预测。
## 按照单变量分类
数据科学家经常需要根据共有的特征,将个体分成不同的组,然后确定组的一些特征。 例如,在使用高尔顿高度数据的例子中,我们看到根据父母的平均高度对家庭进行分类,然后找出每个小组中子女的平均身高,较为实用。
这部分关于将个体分类到非数值类别。我们从回顾
`gourp`
的基本用法开始。
### 计算每个分类的数量
具有单个参数的
`group `
方法计算列中每个值的数量。 结果中,用于分组的列中的每个唯一值是一行。
这是一个关于冰淇淋圆通的小型数据表。
`group `
方法可以用来列出不同的口味,并提供每种口味的计数。
```
py
cones
=
Table
().
with_columns
(
'Flavor'
,
make_array
(
'strawberry'
,
'chocolate'
,
'chocolate'
,
'strawberry'
,
'chocolate'
),
'Price'
,
make_array
(
3.55
,
4.75
,
6.55
,
5.25
,
5.25
)
)
cones
```
| Flavor | Price |
| --- | --- |
| strawberry | 3.55 |
| chocolate | 4.75 |
| chocolate | 6.55 |
| strawberry | 5.25 |
| chocolate | 5.25 |
```
py
cones
.
group
(
'Flavor'
)
```
| Flavor | count |
| --- | --- |
| chocolate | 3 |
| strawberry | 2 |
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录