提交 3685a8c9 编写于 作者: W wizardforcel

2020-04-25 22:24:25

上级 6fcf8451
......@@ -6,13 +6,13 @@
## 20.1 设计带有冗余编码的图例
经常设计几组数据的散点图,使得代表不同组的点仅在颜色上不同。例如,考虑图 20.1 ,它显示了三种不同 _ 虹膜 _ 物种的萼片宽度与萼片长度的关系。 (萼片是开花植物中花的外叶。)代表不同物种的点的颜色不同,但是否则所有点看起来完全相同。尽管这个图只包含三组不同的点,但即使对于具有正常色觉的人来说也难以阅读。出现这个问题的原因是两种 _Iris virginica_ 和 _Iris versicolor_ 的数据点混合在一起,它们的两种颜色,绿色和蓝色,并没有特别明显。
经常设计几组数据的散点图,使得代表不同组的点仅在颜色上不同。例如,考虑图 20.1 ,它显示了三种不同 _ 鸢尾花 _ 物种的萼片宽度与萼片长度的关系。 (萼片是开花植物中花的外叶。)代表不同物种的点的颜色不同,但是否则所有点看起来完全相同。尽管这个图只包含三组不同的点,但即使对于具有正常色觉的人来说也难以阅读。出现这个问题的原因是两种 _Iris virginica_ 和 _Iris versicolor_ 的数据点混合在一起,它们的两种颜色,绿色和蓝色,并没有特别明显。
![](img/71de51cfd932d0a8d7a54d501a2e1240.jpg)
图 20.1:三种不同虹膜物种( _Iris setosa_ , _Iris virginica_ 和 _Iris versicolor_ )的萼片宽度与萼片长度的关系。每个点代表一种植物样品的测量值。对所有点位置施加了少量抖动以防止过度绘图。该图被标记为“坏”,因为 _virginica_ 指向绿色并且 _versicolor_ 点蓝色难以彼此区分。
图 20.1:三种不同鸢尾花物种( _Iris setosa_ , _Iris virginica_ 和 _Iris versicolor_ )的萼片宽度与萼片长度的关系。每个点代表一种植物样品的测量值。对所有点位置施加了少量抖动以防止过度绘图。该图被标记为“坏”,因为 _virginica_ 指向绿色并且 _versicolor_ 点蓝色难以彼此区分。
令人惊讶的是,对于具有红绿色视觉缺陷(deuteranomaly 或 protanomaly)的人而言,绿色和蓝色点看起来比具有正常色觉的人更明显(比较图 20.2 ,顶行,图 20.1 )。另一方面,对于蓝黄色缺乏(tritanomaly)的人来说,蓝色和绿色点看起来非常相似(图 20.2 ,左下)。如果我们打印出灰度图(即我们 _ 去饱和 _ 图),我们就无法区分任何虹膜种类(图 20.2 ,右下图)。
令人惊讶的是,对于具有红绿色视觉缺陷(deuteranomaly 或 protanomaly)的人而言,绿色和蓝色点看起来比具有正常色觉的人更明显(比较图 20.2 ,顶行,图 20.1 )。另一方面,对于蓝黄色缺乏(tritanomaly)的人来说,蓝色和绿色点看起来非常相似(图 20.2 ,左下)。如果我们打印出灰度图(即我们 _ 去饱和 _ 图),我们就无法区分任何鸢尾花种类(图 20.2 ,右下图)。
![](img/430fd625964cb0e46e0832fa7b5bf992.jpg)
......@@ -22,7 +22,7 @@
![](img/528ecc80bd2062e70d3be896630da801.jpg)
图 20.3:三种不同虹膜种类的萼片宽度与萼片长度的关系。与图 20.1 相比,我们交换了 _Iris setosa_ 和 _Iris versicolor_ 的颜色,我们给每个虹膜物种提供了自己的点形状。
图 20.3:三种不同鸢尾花种类的萼片宽度与萼片长度的关系。与图 20.1 相比,我们交换了 _Iris setosa_ 和 _Iris versicolor_ 的颜色,我们给每个鸢尾花物种提供了自己的点形状。
![](img/fc90c9311df98c0533b1add556e078e0.jpg)
......@@ -52,7 +52,7 @@
## 20.2 设计没有图例的数字
尽管通过冗余编码数据可以提高图例的易读性,但是在多种美学中,传说总是给读者带来额外的精神负担。在阅读图例时,读者需要在可视化的一部分中获取信息,然后将其转移到不同的部分。如果我们完全消除这个传说,我们通常可以让读者的生活更轻松。然而,消除传说并不意味着我们根本不提供一个而是在图标题中写出诸如“黄点代表 _ 虹膜[_”的句子。消除图例意味着我们以这样的方式设计图形,即使没有明确的图例,也可以立即显示各种图形元素所代表的内容。
尽管通过冗余编码数据可以提高图例的易读性,但是在多种美学中,传说总是给读者带来额外的精神负担。在阅读图例时,读者需要在可视化的一部分中获取信息,然后将其转移到不同的部分。如果我们完全消除这个传说,我们通常可以让读者的生活更轻松。然而,消除传说并不意味着我们根本不提供一个而是在图标题中写出诸如“黄点代表 _ 鸢尾花[_”的句子。消除图例意味着我们以这样的方式设计图形,即使没有明确的图例,也可以立即显示各种图形元素所代表的内容。
我们可以采用的一般策略称为 _ 直接标记 _,我们将适当的文本标签或其他视觉元素放置在图的其余部分作为指导。我们之前在章 [19](color-pitfalls.html#color-pitfalls) (图 19.2 )中遇到了直接标记,作为绘制具有 50 多种不同颜色的图例的替代方法。为了将直接标签概念应用于股票价格数字,我们将每个公司的名称放在其各自数据行末尾的旁边(图 20.8 )。
......@@ -62,23 +62,23 @@
只要有可能,设计您的数字,使他们不需要传奇。
我们也可以从本章开始就将直接标记概念应用于虹膜数据,特别是图 20.3 。因为它是分成三个不同组的许多点的散点图,所以我们需要直接标记组而不是单个点。一种解决方案是绘制包围大部分点的椭圆,然后标记椭圆(图 20.9 )。
我们也可以从本章开始就将直接标记概念应用于鸢尾花数据,特别是图 20.3 。因为它是分成三个不同组的许多点的散点图,所以我们需要直接标记组而不是单个点。一种解决方案是绘制包围大部分点的椭圆,然后标记椭圆(图 20.9 )。
![](img/2aa1af320ab84d16b0bd8e25a406bdc7.jpg)
图 20.9:三种不同虹膜物种的萼片宽度与萼片长度的关系。我已从此图中删除了背景网格,因为否则图形变得太忙了。
图 20.9:三种不同鸢尾花物种的萼片宽度与萼片长度的关系。我已从此图中删除了背景网格,因为否则图形变得太忙了。
对于密度图,我们可以类似地直接标记曲线而不是提供颜色编码的图例(图 20.10 )。在图 20.9 和 20.10 中,我将文本标签着色为与数据相同的颜色。彩颜色刻度签可以大大增强直接标签效果,但它们也可能变得很差。如果文本标签的打印颜色太浅,则标签变得难以阅读。并且,由于文本由非常细的线组成,因此彩色文本通常看起来比相同颜色的相邻填充区域更亮。我通常通过使用每种颜色的两种不同色调来避开这些问题,对于填充区域使用浅色,对于线条,轮廓和文本使用深色。如果仔细检查图 20.9 或 20.10 ,您将看到每个数据点或阴影区域如何填充浅色并且具有以相同色调的深色绘制的轮廓。文本标签以相同的深色绘制。
![](img/a7e62626501a392d0528e3d323f81325.jpg)
图 20.10:三种不同虹膜物种萼片长度的密度估计值。每个密度估计值直接用相应的物种名称标记。
图 20.10:三种不同鸢尾花物种萼片长度的密度估计值。每个密度估计值直接用相应的物种名称标记。
我们还可以使用密度图(例如图 20.10 中的密度图作为图例替换,将密度图放入散点图的边缘(图 20.11 )。这允许我们直接标记边缘密度图而不是中心散点图,因此得到的图形比具有直接标记椭圆的图 20.9 稍微杂乱一些。
![](img/8210b74a9a6b473c4fe9e4c5e39c185a.jpg)
图 20.11:三种不同虹膜物种的萼片宽度与萼片长度的关系,每种物种的每个变量的边缘密度估计值。
图 20.11:三种不同鸢尾花物种的萼片宽度与萼片长度的关系,每种物种的每个变量的边缘密度估计值。
最后,每当我们在多个美学中编码单个变量时,我们通常不需要多个单独的图例来表示不同的美学。相反,应该只有一个类似图例的视觉元素一次传达所有映射。在我们将相同变量映射到沿主轴和颜色的位置的情况下,这意味着参考颜色条应该沿着并且被集成到同一轴中。图 20.12 显示的情况是我们将温度映射到沿 *x* 轴的位置和颜色,我们因此将颜色图例整合到 *x* 中]轴。
......
......@@ -16,21 +16,21 @@
图 25.2:图 25.1 的相同直方图,现在用实心条绘制。在该图的变形中,年龄分布的形状更容易辨别。
接下来,我们来看看老派的密度绘图。我正在显示三种虹膜的萼片长度分布的密度估计值,完全用黑白绘制为线条图(图 25.3 )。分布仅通过它们的轮廓显示,并且因为图形是黑白的,我们使用不同的线条样式来区分它们。这个数字有两个主要问题。首先,虚线样式不能在曲线下方的区域与其上方的区域之间提供清晰的分离。虽然我们的视觉系统非常擅长将各个线条元素连接成一条连续的线条,但虚线看起来仍然是多孔的,并不能作为封闭区域的强大边界。其次,因为线相交并且它们所包围的区域没有阴影,所以难以从六个不同的形状轮廓中分割出不同的密度。如果我对所有三个分布使用实线而不是虚线,这种效果会更强。
接下来,我们来看看老派的密度绘图。我正在显示三种鸢尾花的萼片长度分布的密度估计值,完全用黑白绘制为线条图(图 25.3 )。分布仅通过它们的轮廓显示,并且因为图形是黑白的,我们使用不同的线条样式来区分它们。这个数字有两个主要问题。首先,虚线样式不能在曲线下方的区域与其上方的区域之间提供清晰的分离。虽然我们的视觉系统非常擅长将各个线条元素连接成一条连续的线条,但虚线看起来仍然是多孔的,并不能作为封闭区域的强大边界。其次,因为线相交并且它们所包围的区域没有阴影,所以难以从六个不同的形状轮廓中分割出不同的密度。如果我对所有三个分布使用实线而不是虚线,这种效果会更强。
![](img/134e5cf965824165228a2c3ccc72f065.jpg)
图 25.3:三种不同虹膜物种萼片长度的密度估计值。用于变色和弗吉尼亚的虚线样式减损了曲线下方的区域与它们上方的区域不同的感觉。
图 25.3:三种不同鸢尾花物种萼片长度的密度估计值。用于变色和弗吉尼亚的虚线样式减损了曲线下方的区域与它们上方的区域不同的感觉。
我们可以尝试通过使用彩色线而不是虚线来解决多孔边界的问题(图 25.4 )。然而,所得图中的密度区域仍然几乎没有视觉存在。总的来说,我发现填充区域的版本(图 25.5 )最清晰直观。然而,重要的是使填充区域部分透明,以便可以看到每个物种的完整分布。
![](img/b4deec32b0c9c55171bd79bd2f5c8f7a.jpg)
图 25.4:三种不同虹膜种的萼片长度的密度估计。通过使用实线,彩色线条,我们解决了图 25.3 的问题,即线条下方和上方的区域似乎是连通的。但是,我们仍然不了解每条曲线下面积的大小。
图 25.4:三种不同鸢尾花种的萼片长度的密度估计。通过使用实线,彩色线条,我们解决了图 25.3 的问题,即线条下方和上方的区域似乎是连通的。但是,我们仍然不了解每条曲线下面积的大小。
![](img/ab45885278251e0d91bb62bc3837f06a.jpg)
图 25.5:三种不同虹膜物种的萼片长度的密度估计值,显示为部分透明的阴影区域。
图 25.5:三种不同鸢尾花物种的萼片长度的密度估计值,显示为部分透明的阴影区域。
当不同的点类型绘制为空心圆,三角形,十字形等时,线图也会出现在散点图的上下文中。例如,请考虑图 25.6 。该图包含许多视觉噪声,并且不同的点类型彼此之间没有很强的分离。用纯色的形状绘制相同的图形解决了这个问题(图 25.7 )。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册