提交 c11b8aea 编写于 作者: W wizardforcel

2020-04-02 23:37:07

上级 009228fe
# 4 色标
# 4 颜色刻度
> 原文: [https://serialmentor.com/dataviz/color-basics.html](https://serialmentor.com/dataviz/color-basics.html)
数据可视化中的颜色有三个基本用例:(i)我们可以使用颜色来区分数据组; (ii)我们可以用颜色来表示数据值; (iii)我们可以使用颜色突出显示。我们使用的颜色类型以及我们使用它们的方式在这三种情况下完全不同。
## 4.1 颜色作为区分的工具
## 4.1 作为区分的工具的颜色
我们经常使用颜色作为区分不具有内在顺序的离散项目或组的手段,例如地图上的不同国家或某个产品的不同制造商。在这种情况下,我们使用 _ 定性 _ 色标。这样的尺度包含一组有限的特定颜色,这些颜色被选择为看起来彼此明显不同,同时也彼此相同。第二个条件要求相对于其他颜色不应该突出任何一种颜色。并且,颜色不应该产生订单的印象,就像连续变亮的一系列颜色的情况一样。这些颜色会在被着色的物品之间产生明显的顺序,根据定义,它们没有顺序。
我们经常使用颜色作为区分不具有内在顺序的离散项目或分组的手段,例如地图上的不同国家或某个产品的不同制造商。在这种情况下,我们使用定性颜色刻度。这样的刻度包含一组有限的特定颜色,选择这些颜色是为了看起来彼此明显不同,同时也彼此相同。第二个条件要求相对于其他颜色,不应该突出任何一种颜色。并且,颜色不应该产生顺序的印象,就像持续变亮的一系列颜色的情况一样。这些颜色会在被着色的物品之间产生明显的顺序,根据定义,它们没有顺序。
许多合适的定性色标很容易获得。图 4.1 显示了三个代表性的例子。特别是,ColorBrewer 项目提供了很好的定性色标选择,包括相当浅和相当深的颜色(Brewer [2017](#ref-ColorBrewer) )。
许多合适的定性颜色刻度很容易获得。图 4.1 显示了三个代表性的例子。特别是,ColorBrewer 项目提供了很好的定性颜色刻度选择,包括相当浅和相当深的颜色(Brewer 2017)。
![](img/efc2c35dd1260f2a6581cb1ea13e276d.jpg)
图 4.1:定性色标示例。 Okabe Ito 量表是本书(Okabe 和 Ito [2008](#ref-Okabe-Ito-CUD) )中使用的默认量表。 ColorBrewer Dark2 量表由 ColorBrewer 项目(Brewer [2017](#ref-ColorBrewer) )提供。 ggplot2 色调比例是广泛使用的绘图软件 ggplot2 中的默认定性比例
图 4.1:定性颜色刻度示例。 Okabe Ito 刻度是本书(Okabe 和 Ito 2008)中使用的默认刻度。 ColorBrewer Dark2 刻度由 ColorBrewer 项目(Brewer 2017)提供。 ggplot2 色调刻度是广泛使用的绘图软件 ggplot2 中的默认定性刻度
作为我们如何使用定性色标的一个例子,请考虑图 4.2 。它显示了美国各州 2000 年至 2010 年的人口增长率。我按照人口增长的顺序安排了各州,我按地理区域对它们进行了着色。这种着色突出表明,同一地区的国家经历了类似的人口增长。特别是,西部和南部各州人口增长最多,而中西部和东北部各州增长较少。
作为我们如何使用定性颜色刻度的一个例子,请考虑图 4.2 。它显示了美国各州 2000 年至 2010 年的人口增长率。我按照人口增长的顺序排列了各州,我按地理区域对它们进行了着色。这种着色突出表明,同一地区的国家经历了类似的人口增长。特别是,西部和南部各州人口增长最多,而中西部和东北部各州增长较少。
![](img/e9fb4cfa9f3b379f7e32de170137cef3.jpg)
图 4.2:2000 年至 2010 年美国的人口增长。西部和南部的国家增幅最大,而中西部和东北部的国家增长幅度小得多,甚至在密歇根州也有所下降。数据来源:美国人口普查局
图 4.2:2000 年至 2010 年美国的人口增长。西部和南部的州增长最大,而中西部和东北部的州增长小得多,甚至在密歇根州也有所下降。数据来源:美国人口普查局
## 4.2 颜色代表数据值
## 4.2 代表数据值的颜色
颜色也可用于表示数据值,例如收入,温度或速度。在这种情况下,我们使用 _ 顺序 _ 色标。这样的标度包含一系列颜色,其清楚地指示(i)哪些值大于或小于哪些值,以及(ii)两个特定值彼此有多远。第二点意味着需要感知色标在其整个范围内均匀变化。
颜色也可用于表示数据值,例如收入,温度或速度。在这种情况下,我们使用顺序颜色刻度。这样的刻度包含一系列颜色,其清楚地指示(i)哪些值大于或小于哪些值,以及(ii)两个特定值彼此有多远。第二点意味着需要感知颜色刻度在其整个范围内均匀变化。
顺序标度可以基于单个色调(例如,从深蓝色到浅蓝色)或基于多个色调(例如,从深红色到浅黄色)(图 4.3 )。多色调比例倾向于遵循自然界中可见的颜色渐变,例如深红色,绿色或蓝色至浅黄色,或深紫色至浅绿色。相反,例如深黄色至浅蓝色,看起来不自然,并没有做出有用的顺序刻度。
顺序刻度可以基于单个色调(例如,从深蓝色到浅蓝色)或基于多个色调(例如,从深红色到浅黄色)(图 4.3 )。多色调刻度倾向于遵循自然界中可见的颜色渐变,例如深红色,绿色或蓝色至浅黄色,或深紫色至浅绿色。相反,例如深黄色至浅蓝色,看起来不自然,并没有生成有用的顺序刻度。
![](img/e9885ad9647bc799bd2d8d65e1abb3e6.jpg)
图 4.3:连续色标示例。 ColorBrewer Blues 刻度是一种单色刻度,从深蓝到浅蓝不等。 Heat 和 Viridis 鳞片是多色调鳞片,分别从深红色到浅黄色,从深蓝色到绿色到浅黄色。
图 4.3:连续颜色刻度示例。 ColorBrewer Blues 刻度是一种单色刻度,从深蓝到浅蓝不等。 Heat 和 Viridis 刻度是多色调刻度,分别从深红色到浅黄色,从深蓝色到绿色到浅黄色。
当我们想要显示数据值如何跨地理区域变化时,将数据值表示为颜色特别有用。在这种情况下,我们可以绘制地理区域的地图,并通过数据值对它们进行着色。这种地图称为 _ 等值线 _。图 4.4 显示了一个示例,其中我将德克萨斯州每个县的年度中位数收入映射到这些县的地图上。
当我们想要显示数据值如何跨地理区域变化时,将数据值表示为颜色特别有用。在这种情况下,我们可以绘制地理区域的地图,并按照数据值对它们进行着色。这种地图称为等值线。图 4.4 显示了一个示例,其中我将德克萨斯州每个县的年收入中位数映射到这些县的地图上。
![](img/a3e525a9682ffe2d8a33b0d18cc87cd6.jpg)
图 4.4:德克萨斯州的年收入中位数。德克萨斯州主要城市地区的收入中位数最高,特别是在休斯顿和达拉斯附近。西德克萨斯州的 Loving County 没有中位数收入估算值,因此该县显示为灰色。数据来源:2015 年五年美国社区调查
图 4.4:德克萨斯州的年收入中位数。德克萨斯州主要城市地区的收入中位数最高,特别是在休斯顿和达拉斯附近。西德克萨斯州的 Loving 县没有中位数收入估算值,因此该县显示为灰色。数据来源:2015 年的美国五年社区调查
在某些情况下,我们需要将数据值的偏差可视化为相对于中性点的两个方向之一。一个简单的例子是包含正数和负数的数据集。我们可能想要显示具有不同颜色的那些,这样就可以立即看出一个值是正还是负,以及它在任何一个方向上偏离零的距离。在这种情况下,适当的色标是 _ 发散 _ 色标。我们可以将一个不同的尺度视为两个连续的尺度,它们在一个共同的中点处拼接在一起,通常用浅色来表示(图 4.5 )。需要平衡发散的刻度,以便从中心的浅色到外侧的深色在任一方向上大致相同。否则,数据值的感知幅度将取决于它是否高于或低于中点值。
在某些情况下,我们需要将数据值的偏差可视化为相对于中性点的两个方向之一。一个简单的例子是包含正数和负数的数据集。我们可能想要使用不同颜色来显示它们,这样就可以立即看出一个值是正还是负,以及它在任何一个方向上到零的距离。在这种情况下,适当的颜色刻度是发散颜色刻度。我们可以将一个不同的刻度视为两个连续的刻度,它们在一个共同的中点处拼接在一起,通常用浅色来表示(图 4.5 )。发散刻度需要平衡,以便从中心的浅色到外侧的深色的渐变,在任一方向上大致相同。否则,数据值的感知幅度将取决于它是否高于或低于中点值。
![](img/6fcaf2c295d2c72919ec740c068d358a.jpg)
图 4.5:示例发散色标。发散的尺度可以被认为是在共同的中点颜色处拼接在一起的两个连续尺度。发散尺度的常见颜色选择包括棕色至绿蓝色,粉红色至黄绿色以及蓝色至红色。
图 4.5:发散颜色刻度示例。发散的刻度可以被认为是在共同的中点颜色处拼接在一起的两个连续刻度。发散刻度的常见颜色选择包括棕色至蓝绿色,粉红色至黄绿色以及蓝色至红色。
作为分散色标的示例应用,请考虑图 4.6 ,其显示在德克萨斯州县中识别为白色的人的百分比。尽管百分比总是一个正数,但这里的分歧是合理的,因为 50%是一个有意义的中点值。高于 50%的数字表明白人占多数,低于 50%的数字表示相反。可视化清楚地显示了哪些县白人占多数,其中他们是少数,白人和非白人以大致相等的比例出现。
作为发散颜色刻度的示例应用,请考虑图 4.6 ,其显示德克萨斯州的县的白人百分比。尽管百分比总是一个正数,但这里的发散刻度是合理的,因为 50% 是一个有意义的中点值。高于 50% 的数字表明白人占多数,低于 50% 的数字表示相反。可视化清楚地显示了哪些县白人占多数,哪些县他们是少数,以及哪些县中白人和非白人以大致相等的比例出现。
![](img/3213708ae7105d0438dafba70dae6f1f.jpg)
图 4.6:在德克萨斯州县中被识别为白人的百分比。白人在德克萨斯州北部和东部占多数,但在德克萨斯州南部或西部则不然。数据来源:2010 年美国十年普查
图 4.6:德克萨斯州的县的白人的百分比。白人在德克萨斯州北部和东部占多数,但在德克萨斯州南部或西部则不然。数据来源:2010 年美国十年普查
## 4.3 颜色作为突出显示的工具
颜色也可以是突出显示数据中特定元素的有效工具。数据集中可能存在特定的类别或值,其中包含有关我们想要讲述的故事的关键信息,我们可以通过向读者强调相关的图形元素来加强故事。实现这一重点的一个简单方法是将这些图形元素用一种颜色或一组颜色着色,这些颜色或颜色可以生动地突出图形的其他部分。这种效果可以通过 _ 重点 _ 色标来实现,这些色标是包含一组柔和色彩和一组更强,更暗和/或更饱和色彩的色标(图 4.7 )。
颜色也可以是突出显示数据中特定元素的有效工具。数据集中可能存在特定的类别或值,其中包含有关我们想要讲述的故事的关键信息,我们可以通过向读者强调相关的图形元素来强调故事。实现强调的一个简单方法是,将这些图形元素用一种颜色或一组颜色着色,这些颜色或颜色可以生动地突出图形的其他部分。这种效果可以通过重点颜色刻度来实现,这些颜色刻度包含一组柔和颜色和一组匹配的更强,更暗和/或更柔和的颜色(图 4.7 )。
![](img/4fd912502ba748a4c10a1a57629101a1.jpg)
图 4.7:示例重音色标,每个都有四种基色和三种强调色。重点色标可以通过几种不同的方式得出:(顶部)我们可以采用现有的色标(例如,Okabe Ito 标度,图 4.1 )并使某些颜色变淡和/或部分去饱和,同时使其他颜色变暗; (中)我们可以采用灰度值并将它们与颜色配对; (下)我们可以使用现有的重音色标,例如 ColorBrewer 项目中的那个。
图 4.7:重点颜色刻度示例,每个都有四种基色和三种强调色。重点颜色刻度可以通过几种不同的方式得出:(顶部)我们可以采用现有的颜色刻度(例如,Okabe Ito 刻度,图 4.1 )并使某些颜色变淡和/或部分去饱和,同时使其他颜色变暗;(中)我们可以采用灰度值并将它们与颜色配对; (下)我们可以使用现有的重点颜色刻度,例如 ColorBrewer 项目中的那个。
作为相同数据如何支持具有不同着色方法的不同故事的示例,我创建了图 4.2 的变体,现在我突出显示两个特定状态,Texas 和 Louisiana(图 4.8 ])。这两个州都在南方,他们是近邻,然而一个州(德克萨斯州)是美国增长速度第五快的州,而另一个州是 2000 年至 2010 年间增长最慢的州。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册