提交 eb759912 编写于 作者: W wizardforcel

ch3.

上级 0d08fe0c
......@@ -669,3 +669,48 @@ millions.bin('Adjusted Gross', bins=uneven_again)
+ 条形图为每个类别展示一个数量。 它们通常用于显示类别变量的分布。 直方图显示定量变量的分布。
+ 条形图中的所有条形都具有相同的宽度,相邻的条形之间有相等的间距。 直方图的条形可以具有不同的宽度,并且是连续的。
+ 条形图中条形的长度(或高度,如果垂直绘制)与每个类别的值成正比。 直方图中条形的高度是密度的度量;直方图中的条形的面积与桶中的条目数量成正比。
## 重叠的图表
在这一章中,我们学习了如何通过绘制图表来显示数据。 这种可视化的常见用法是比较两个数据集。 在本节中,我们将看到如何叠加绘图,即将它们绘制在单个图形中,拥有同一对坐标轴
为了使重叠有意义,重叠的图必须表示相同的变量并以相同的单位进行测量。
为了绘制重叠图,可以用相同的方法调用`scatter``plot``barh`方法。 对于`scatter``plot`,一列必须作为所有叠加图的公共横轴。 对于`barh`,一列必须作为一组类别的公共轴。 一般的调用看起来像这样:
```py
name_of_table.method(column_label_of_common_axis, array_of_labels_of_variables_to_plot)
```
更常见的是,我们首先仅仅选取图表所需的列。之后通过指定共同轴上的变量来调用方法。
```py
name_of_table.method(column_label_of_common_axis)
```
### 散点图
高尔顿(Franics Galton,1822 ~ 1911 年)是一位英国博学家,他是分析数值变量之间关系的先驱。 他对有争议的优生学领域特别感兴趣,实际上,他创造了这个术语 - 这涉及到如何将物理特征从一代传到下一代。
高尔顿精心收集了大量的数据,其中一些我们将在本课程中分析。 这是高尔顿的,有关父母及其子女身高的数据的子集。 具体来说,数据由 179 名男性组成,他们在家庭中第一个出生。数据是他们自己的高度和父母的高度。所有的高度都是以英寸来测量的。
```py
heights = Table.read_table('galton_subset.csv')
heights
```
| father | mother | son |
| --- | --- | --- |
| 78.5 | 67 | 73.2 |
| 75.5 | 66.5 | 73.5 |
| 75 | 64 | 71 |
| 75 | 64 | 70.5 |
| 75 | 58.5 | 72 |
| 74 | 68 | 76.5 |
| 74 | 62 | 74 |
| 73 | 67 | 71 |
| 73 | 67 | 68 |
| 73 | 66.5 | 71 |
(省略了 169 行)
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册