ch3.

eb759912 · wizardforcel · 0d08fe0c · eb759912
隐藏空白更改
内联并排

Showing with 45 addition and 0 deletion

6.md 6.md +45 -0

未找到文件。
--- a/6.md
+++ b/6.md
@@ -669,3 +669,48 @@ millions.bin('Adjusted Gross', bins=uneven_again)
 +   条形图为每个类别展示一个数量。 它们通常用于显示类别变量的分布。 直方图显示定量变量的分布。
 +   条形图中的所有条形都具有相同的宽度，相邻的条形之间有相等的间距。 直方图的条形可以具有不同的宽度，并且是连续的。
 +   条形图中条形的长度（或高度，如果垂直绘制）与每个类别的值成正比。 直方图中条形的高度是密度的度量；直方图中的条形的面积与桶中的条目数量成正比。
+
+## 重叠的图表
+
+在这一章中，我们学习了如何通过绘制图表来显示数据。 这种可视化的常见用法是比较两个数据集。 在本节中，我们将看到如何叠加绘图，即将它们绘制在单个图形中，拥有同一对坐标轴
+
+为了使重叠有意义，重叠的图必须表示相同的变量并以相同的单位进行测量。
+
+为了绘制重叠图，可以用相同的方法调用`scatter`，`plot`和`barh`方法。 对于`scatter`和`plot`，一列必须作为所有叠加图的公共横轴。 对于`barh`，一列必须作为一组类别的公共轴。 一般的调用看起来像这样：
+
+```py
+name_of_table.method(column_label_of_common_axis, array_of_labels_of_variables_to_plot)
+```
+
+更常见的是，我们首先仅仅选取图表所需的列。之后通过指定共同轴上的变量来调用方法。
+
+```py
+name_of_table.method(column_label_of_common_axis)
+```
+
+### 散点图
+
+高尔顿（Franics Galton，1822 ~ 1911 年）是一位英国博学家，他是分析数值变量之间关系的先驱。 他对有争议的优生学领域特别感兴趣，实际上，他创造了这个术语 - 这涉及到如何将物理特征从一代传到下一代。
+
+高尔顿精心收集了大量的数据，其中一些我们将在本课程中分析。 这是高尔顿的，有关父母及其子女身高的数据的子集。 具体来说，数据由 179 名男性组成，他们在家庭中第一个出生。数据是他们自己的高度和父母的高度。所有的高度都是以英寸来测量的。
+
+```py
+heights = Table.read_table('galton_subset.csv')
+heights
+```
+
+| father | mother | son |
+| --- | --- | --- |
+| 78.5 | 67 | 73.2 |
+| 75.5 | 66.5 | 73.5 |
+| 75 | 64 | 71 |
+| 75 | 64 | 70.5 |
+| 75 | 58.5 | 72 |
+| 74 | 68 | 76.5 |
+| 74 | 62 | 74 |
+| 73 | 67 | 71 |
+| 73 | 67 | 68 |
+| 73 | 66.5 | 71 |
+
+（省略了 169 行）
+