提交 8ed74dda 编写于 作者: W wizardforcel

ch7pic

上级 38af1374
......@@ -18,7 +18,7 @@ def double(x):
我们通过编写`def`来开始定义任何函数。 下面是这个小函数的其他部分(语法)的细分:
![](img/7-1.jpg)
当我们运行上面的单元格时,没有使特定的数字加倍,并且`double`主体中的代码还没有求值。因此,我们的函数类似于一个菜谱。 每次我们遵循菜谱中的指导,我们都需要以食材开始。 每次我们想用我们的函数来使一个数字加倍时,我们需要指定一个数字。
......@@ -130,6 +130,8 @@ The biggest difference is 5
这就是当我们运行单元格时,所发生的事情。
![](img/7-2.jpg)
## 多个参数
可以有多种方式来推广一个表达式或代码块,因此一个函数可以有多个参数,每个参数决定结果的不同方面。 例如,我们以前定义的百分比`percents`,每次都四舍五入到两位。 以下两个参的数定义允许不同调用四舍五入到不同的位数。
......@@ -327,6 +329,8 @@ heights
heights.scatter(0)
```
![](img/7-3.png)
现在假设高尔顿遇到了新的一对夫妇,与他的数据集类似,并且想知道他们的子女有多高。考虑到双亲身高是 68 英寸,他预测子女身高的一个好方法是什么?
一个合理的方法是基于约 68 英寸的双亲身高对应的所有点,来做预测。预测值等于从这些点计算的子女身高的均值。
......@@ -344,6 +348,8 @@ _ = plots.plot([68.5, 68.5], [50, 85], color='red', lw=2)
_ = plots.scatter(68, 66.24, color='gold', s=40)
```
![](img/7-4.png)
为了准确计算出金色的点的位置,我们首先需要确定直线之间的所有点。 这些点对应于`MidParent`在 67.5 英寸和 68.5 英寸之间的行。
```py
......@@ -430,6 +436,8 @@ heights_with_predictions
heights_with_predictions.scatter('MidParent')
```
![](img/7-5.png)
金色的点的图形称为均值图,因为每个金色的点都是两条直线的中心,就像之前绘制的那样。每个都按照给定的双亲高度,做出了子女高度的预测。例如,散点图显示,对于 72 英寸的双亲高度,子女的预测高度将在 68 英寸和 69 英寸之间,事实上,`predict_child(72)`返回 68.5。
高尔顿的计算和可视化与我们非常相似,除了他没有 Python。他通过散点图绘制了均值图,并注意到它大致沿着直线。这条直线现在被称为回归线,是最常见的预测方法之一。高尔顿的朋友,数学家卡尔·皮尔森(Karl Pearson)用这些分析来形式化关联的概念。
......@@ -979,6 +987,8 @@ distributions
distributions.select(0, 1, 4).barh(0)
```
![](img/7-6.png)
## 按列连接表
通常,同一个人的数据在多个表格中维护。 例如,大学的一个办公室可能有每个学生完成学位的时间的数据,而另一个办公室则有学生学费和经济援助的数据。
......@@ -1167,12 +1177,16 @@ commute = trips.where('Duration', are.below(1800))
commute.hist('Duration', unit='Second')
```
![](img/7-7.png)
我们可以通过指定更多的桶来获得更多的细节。 但整体形状并没有太大变化。
```py
commute.hist('Duration', bins=60, unit='Second')
```
![](img/7-8.png)
### 使用`group `和`pivot`探索数据
我们可以使用`group `来识别最常用的起点站。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册