之前的一个阶段公司一直在做大屏的项目,所以我也一直在研究数据可视化的设计,当我阅读《数据可视化》时,看到了如下的一张图(下图),是关于分析需求可采用的统计可视化方法,给了我很大的启发。于是我想把这张图进行拓展,从如何选择可视化图表的角度来继续深挖。
在工作的实践中,我将选择一个可视化图表分成如下几个步骤:分析数据>明确目标>分析功能>选择图表(下图)
1.获取数据
1.1数据认知
在获取数据之前,我们先了解一下什么是数据。人们对于数据的认知,一般都是经过从数据模型到概念模型的过程,最后得到数据在实际中的具体语义。在处理数据时,最初接触的是数据模型。例如一组数据:7.8、12.5、14.3、…,首先被看作是一组浮点数据,可以应用加减乘除等操作;另一组数据:白、黑、黄、…,则被视为一组根据颜色分类的数据。概念模型是对数据的高层次描述,对应于人们对于数据的具体认知。对数据进行进一步处理之前,需要定义数据的概念和他们之间联系,同时定义数据的语义和他们所代表的含义。概念模型的建立跟实际应用紧密相关。例如,数值数据可用于表达温度、高度、产量等,而类别数据则可表达性别、人种等不同的意义。
1.2数据类型
数据类型一般可以分为类别型数据、数值型数据和有序型数据。类别型数据用于区分物体,数值型数据提供定量信息,有序型数据用来表示对象间的顺序关系。例如我们最常见的纵向柱状图,类别型数据映射到的是x轴,数值型数据映射到y轴,有序型数据则是对象和数值的比较关系。
所以当我们拿到数据时,需要明确手中数据的类型,因为基础的可视化设计一般针对于这三种数据展开的,复杂型数据通常是这三类数据的组合和变化。
2.明确目标
2.1可视化原则
可视化的首要任务是准确的展示和传达数据所包含的信息。在此前提下,针对特定的用户对象,设计者可以根据用户的预期和需求,提供有效辅助手段方便用户理解数据,从而完成有效的可视化。
2.2可视化图表类型
从可视化图表类型来说,可以分为比较类、分布类、流程类、占比类、区间类、关联类、趋势类、时间类、地图类等。所以,针对用户的预期和需求,明确目标的这一过程就是选择合适的可视化图表类型。
在这一步骤中我们不仅需要明确考虑“用户想要知道什么?”,同时还要考虑“如果用户知道了这个信息,会用它来做什么?”。所以我们选择使用什么功能的图表将有助于用户做决策。
3.分析功能
分析功能,是指在明确目标和场景的前提下,从数据的特性选择更加细分的图表类型。对于比较类图表来说,可以细分为条目相关、数值相关、目标相关、周期相关、股票相关、分布相关等。
4.选择图表(比较类图表)
所以我们在获取数据、明确目标和分析功能之后,就要针对图表展示的目的和表现层面选择合适的图表(下图)。
4.1条目相关
4.1.1柱状图
当我们拥有一组类别型数据、一个连续数值型数据时,同时为了对比数值,我们就可以选择柱状图来展示图表。但同时需要注意的是类别型数据不超过12条可以选择纵向柱状图,不超过30条数据时可以选择横向柱状图,而超过30条数据,柱状图将不再适用。
4.1.2南丁格尔玫瑰图和玉玦图
南丁格尔玫瑰图和玉玦图都是极坐标下绘制的柱状图。不同的是南丁格尔玫瑰图通过面积大小的比值,所以数值的比较非常直观。而由于我们的视觉系统更善于比较直线,所以玉玦图在数值的比较上并不直观,其更多的是一种审美上的需求。
4.1.3雷达图
当我们拥有一组类别型数据、一个连续数值型数据时,同时为了对比数据权重高低情况,展示性能数据,我们就可以选择雷达图。着重要强调的是,虽然雷达图每个轴线都表示不同维度,但使用上为了容易理解和统一比较。使用雷达图经常会人为的将将多个坐标轴都统一成一个度量。
4.1.4双向柱状图
当我们拥有一组类别型数据、两个连续数值型数据时,同时为了对比数值,我们就可以选择双向柱状图来展示图表。其中分类轴表示需要对比的分类维度,连续轴代表相应的数值,分为两种情况,一种是正向刻度值与反向刻度值完全对称,另一种是正向刻度值与反向刻度值反向对称,即互为相反数。
4.1.5层叠面积图
当我们拥有一组类别型数据、两个连续数值型数据时,同时为了对比趋势,我们就可以选择层叠面积图来展示图表。层叠面积图上的最大的面积代表了所有的数据量的总和,是一个整体。各个叠起来的面积表示各个数据量的大小,这些堆叠起来的面积图在表现大数据的总量分量的变化情况时格外有用,所以层叠面积图不适用于表示带有负值的数据集。非常适用于对比多变量随时间变化的情况。
4.1.6气泡图
当我们拥有一组类别型数据、三个连续数值型数据时我们就可以选择气泡图来展示图表。气泡图通常用于比较和展示不同类别圆点(这里我们称为气泡)之间的关系,通过气泡的位置以及面积大小。从整体上看,气泡图可用于分析数据之间的相关性。
4.1.7层叠柱状图和分组柱状图
当我们拥有两组类别型数据、一个连续数值型数据时,同时数据在同一分类下,我们可以选择层叠柱状图,数据不同分类,则选择分组柱状图。层叠面积图上的最大的面积代表了所有的数据量的总和,是一个整体。而分组柱状图经常用于不同组间数据的比较,这些组都包含了相同分类的数据。
4.2数值相关
4.2.1漏斗图
漏斗图适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。
4.3目标相关
4.3.1子弹图
子弹图的发明是为了取代仪表盘上常见的那种里程表,时速表等基于圆形的信息表达方式,可以表达一项数据与不同目标的校对结果。子弹图无修饰的线性表达方式使我们能够在狭小的空间中表达丰富的数据信息,线性的信息表达方式与我们习以为常的文字阅读相似,相对于圆形构图的信息表达,在信息传递上有更大的效能优势。
4.4周期相关
4.4.1螺旋图
基于阿基米德螺旋坐标系,常用于绘制随时间变化的数据,从螺旋的中心开始向外绘制。螺旋图节省空间,可用于显示大时间段数据的变化趋势。
4.5股票相关
4.5.1K线图
K 线图,原名蜡烛图,又称阴阳图、棒线、红黑线或蜡烛线,常用于展示股票交易数据。K 线就是指将各种股票每日、每周、每月的开盘价、收盘价、最高价、最低价等涨跌变化状况,用图形的方式表现出来。
参考资料
《数据可视化》