提交 0060a2ec 编写于 作者: W wizardforcel

2020-04-06 22:58:43

上级 4cd58692
# 9 一次可视化多个发行版
# 9 一次可视化多个分布
> 原文: [https://serialmentor.com/dataviz/boxplots-violins.html](https://serialmentor.com/dataviz/boxplots-violins.html)
在许多情况下,我们希望同时可视化多个分布。例如,考虑天气数据。我们可能想要了解不同月份的温度变化情况,同时还显示每个月内观测到的温度分布。这种情况需要一次显示 12 个温度分布,每个月一个。在这种情况下,章节 [7](histograms-density-plots.html#histograms-density-plots)[8](ecdf-qq.html#ecdf-qq) 中讨论的所有可视化都不起作用。相反,可行的方法包括箱形图,小提琴图和脊线图。
在许多情况下,我们希望同时可视化多个分布。例如,考虑天气数据。我们可能想要了解不同月份的温度变化情况,同时还显示每个月内观测到的温度分布。这种情况需要一次显示 12 个温度分布,每个月一个。在这种情况下,第七和八章中讨论的所有可视化都不起作用。相反,可行的方法包括箱形图,提琴图和脊线图。
每当我们处理许多分布时,根据响应变量和一个或多个分组变量进行思考是有帮助的。响应变量是我们想要显示其分布的变量。分组变量定义具有响应变量的不同分布的数据的子集。例如,对于跨月的温度分布,响应变量是温度,分组变量是月。本章讨论的所有技术都沿一个轴绘制响应变量,沿另一个轴绘制分组变量。在下文中,我将首先描述沿垂直轴显示响应变量的方法,然后我将描述沿水平轴显示响应变量的方法。在所讨论的所有情况下,我们都可以翻转轴并获得另一种可行的可视化。我在这里展示了各种可视化的规范形式。
......
......@@ -2,36 +2,36 @@
> 原文: [https://serialmentor.com/dataviz/visualizing-proportions.html](https://serialmentor.com/dataviz/visualizing-proportions.html)
我们经常想要展示一些组,实体或金额如何分解成各自代表整体 _ 比例 _ 的单个部分。常见的例子包括一群人中男女比例,选举中不同政党投票的百分比,或公司的市场份额。这种可视化的原型是饼图,在任何业务演示中无所不在,并且在数据科学家中备受诟病。正如我们将要看到的,可视化比例可能具有挑战性,特别是当整体被分成许多不同的部分或者我们希望看到随时间或不同条件的比例变化时。没有一种理想的可视化方法始终有效。为了说明这个问题,我将讨论一些不同的场景,每个场景都需要不同类型的可视化。
我们经常想要展示一些分组,实体或金额如何分解成单个部分,各自代表整体的一部分。常见的例子包括一群人中的男女比例,选举中不同政党投票的百分比,或公司的市场份额。这种可视化的原型是饼图,在任何业务演示中无所不在,并且在数据科学家中备受诟病。正如我们将要看到的,可视化比例可能具有挑战性,特别是当整体被分成许多不同的部分,或者我们希望看到不同部分随时间或条件变化的时候。没有一种理想的可视化方法始终有效。为了说明这个问题,我将讨论一些不同的场景,每个场景都需要不同类型的可视化。
请记住:您始终需要选择最适合您的特定数据集的可视化,并突出显示您要显示的关键数据功能
请记住:您始终需要选择最适合您的特定数据集的可视化,并突出显示您要显示的关键数据特征
## 10.1 饼图的一个案例
从 1961 年到 1983 年,德国议会(称为 _Bundestag_ )由三个不同党派的成员组成,CDU / CSU,SPD 和 FDP。在大部分时间里,CDU / CSU 和 SPD 的座位数量大致相当,而 FDP 通常只占一小部分席位。例如,在 1976 年至 1980 年的第 8 届联邦议院中,基民盟/科罗拉多州立大学共有 243 个席位,SPD 214 和 FDP 39,共计 496 个。这种议会数据最常见的是饼图(图[] 10.1](visualizing-proportions.html#fig:bundestag-pie) )。
从 1961 年到 1983 年,德国议院(称为 Bundestag)由三个不同党派的成员组成,CDU/CSU,SPD 和 FDP。在大部分时间里,CDU/CSU 和 SPD 的席位数量大致相当,而 FDP 通常只占一小部分席位。例如,在 1976 年至 1980 年的第 8 届联邦议会中,CDU/CSU 共有 243 个席位,SPD 有 214,FDP 有 39,共计 496 个。这种议会数据最常以饼图可视化(图 10.1)。
![](img/eaca8af1d13d9c93da6b2976cf4d5033.jpg)
图 10.1:1976 年至 1980 年第 8 届德国联邦议院的党派组成,可视化为饼图。这种可视化清楚地表明,SPD 和 FDP 的执政联盟比反对派 CDU / CSU 少占多数
图 10.1:1976 年至 1980 年第 8 届德国联邦议院的党派组成,可视化为饼图。这种可视化清楚地表明,SPD 和 FDP 的执政联盟与反对派 CDU/CSU 相比多一小部分
饼图将圆圈分成切片,使得每个切片的面积与其表示的总分数成比例。可以在矩形上执行相同的过程,结果是堆积条形图(图 10.2 )。根据我们是垂直还是水平切割条形,我们获得垂直堆叠的条形图(图 10.2 a)或水平堆叠的条形图(图 10.2 b)。
饼图将圆圈分成切片,使得每个切片的面积与其表示的总体比例成正比。可以在矩形上执行相同的过程,结果是堆积条形图(图 10.2 )。根据我们是垂直还是水平切割条形,我们获得垂直堆叠的条形图(图 10.2 a)或水平堆叠的条形图(图 10.2 b)。
![](img/60522ab15c82aec65bfae7c0935fcd08.jpg)
图 10.2:1976 年至 1980 年第 8 届德国联邦议院的党派组成,可视化为叠条。 (a)垂直堆放的酒吧。 (b)水平堆放的酒吧。 SPD 和 FDP 共同拥有的席位并不比 CDU / CSU 更明显。
图 10.2:1976 年至 1980 年第 8 届德国联邦议院的党派组成,可视化为堆叠条形。 (a)垂直堆叠的条形。 (b)水平堆叠的条形。 SPD 和 FDP 共同拥有的席位并不比 CDU / CSU 更明显。
我们也可以从图 10.2 a 中取出它们并将它们并排放置,而不是将它们堆叠在一起。这种可视化使得更容易直接比较三组,但它模糊了数据的其他方面(图 10.3 )。最重要的是,在并排条形图中,每个条形与总数的关系在视觉上并不明显。
我们也可以从图 10.2a 中取出它们并将它们并排放置,而不是将它们堆叠在一起。这种可视化使得更容易直接比较三组,但它模糊了数据的其他方面(图 10.3)。最重要的是,在并排条形图中,每个条形与总数的关系在视觉上并不明显。
![](img/398be69c2b2d3311aab54324f7a4725f.jpg)
图 10.3:1976 年至 1980 年第 8 届德国联邦议院的党派组成,可视化为并排的酒吧。如图 10.2 所示,SPD 和 FDP 共同拥有的席位并不比 CDU / CSU 更明显。
图 10.3:1976 年至 1980 年第 8 届德国联邦议院的党派组成,可视化为并排的条形。如图 10.2 所示,SPD 和 FDP 共同拥有的席位并不比 CDU / CSU 更明显。
许多作者断然拒绝饼图并赞成并排或堆叠条形图。其他人则在某些应用程序中捍卫饼图的使用。我个人认为,这些可视化中没有一个比任何其他可视化都优越。根据数据集的功能和您想要讲述的具体故事,您可能希望采用一种或另一种方法。在第 8 届德国联邦议院的情况下,我认为饼图是最好的选择。它清楚地表明,SPD 和 FDP 的执政联盟共同占 CDU / CSU 的一小部分(图 10.1 )。在任何其他图中,这一事实在视觉上并不明显(图 10.2 和 10.3 )。
许多作者断然拒绝饼图并赞成并排或堆叠条形图。其他人则在某些应用中坚持使用饼图。我个人认为,这些可视化中没有一个比任何其他可视化都优越。根据数据集的特征和您想要讲述的具体故事,您可能希望采用一种或另一种方法。在第 8 届德国联邦议院的情况下,我认为饼图是最好的选择。它清楚地表明,SPD 和 FDP 的共同执政联盟比 CDU / CSU 多一小部分(图 10.1)。在任何其他图中,这一事实在视觉上并不明显(图 10.2 和 10.3)。
通常,当目标是强调简单分数(例如,一半,三分之一或四分之一)时,饼图效果很好。当我们有非常小的数据集时,它们也能很好地工作。单个饼图,如图 10.1 ,看起来很好,但是如图 10.2 a 中的单列堆叠条看起来很尴尬。另一方面,堆叠条可以用于多个条件或时间序列的并排比较,并且当我们想要直接比较各个部分时,并排的条是优选的。表 10.1 中提供了饼图,堆积条和并排条的各种优缺点的摘要。
通常,当目标是强调简单比例(例如,一半,三分之一或四分之一)时,饼图效果很好。当我们有非常小的数据集时,它们也能工作得很好。单个饼图,如图 10.1 ,看起来很好,但是如图 10.2a 中的单列堆叠条形看起来很尴尬。另一方面,堆叠条形可以用于多个条件或时间序列的并排比较,并且当我们想要直接比较各个部分时,并排条形是优选的。表 10.1 中提供了饼图,堆叠条形和并排条形的各种优缺点的摘要。
<caption>Table 10.1: Pros and cons of common approaches to visualizing proportions: pie charts, stacked bars, and side-by-side bars.</caption> <colgroup><col width="34%"> <col width="21%"> <col width="21%"> <col width="21%"></colgroup>
| | 饼形图 | 堆积的酒吧 | 并排的酒吧 |
| | 饼形图 | 堆积的条形 | 并排的条形 |
| --- | :-: | :-: | :-: |
| 清楚地将数据可视化为整体的比例 | ✔ | ✔ | ✖ |
| 可以轻松直观地比较相对比例 | ✖ | ✖ | ✔ |
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册