之前一篇文章 为什么我们需要数据可视化 简单的介绍我们为什么要进行数据可视化,文章里面简单的列出三个方面:
I. 在我们的五官中,视觉接受的信息量远远要大于别的感官。
II. 数据可视化可以让我们更全面的认知数据。
III.我们大脑的记忆力是有限的,相比记住所有的数据进行分析。我们将数据总结到一张图表里面,通过这样的方式我们更容易记住我们分析的结果。
简化认知
觉得还有一些比较重要的内容没提到,数据可视化是在大数据时代的背景下面产生的。它很重要的作用就是用来简化复杂的数据,把数据内部的信息简单而又直观的呈现出来。之前看到有人问数据可视化是让数据变得更加简单易懂,还是变得更复杂。
我们先看看当下两位可视化的大牛Card, Mackinlay, and Shneiderman对可视化的定义
"the use of computer-supported, interactive visual representations of data to amplify cognition."
我简单翻译一下: "利用电脑和交互式的视觉表示数据来简化认知过程",当当看到这一点,起码我们可以肯定,数据可视化最重要的作用是简化认知过程,如果认知过程被复杂化,那应该能在叫做可视化了,只能算是数据艺术创作。
数据分析一个部分
在数据可视化兴起之初,有很多人质疑数据可视化的价值,包括自己也一直在问这个问题,可视化的价值在哪里。我们知道,可视化是用来进行数据分析的。但是数据分析在之前就有一套比较完善的系统了。比如我们可以简单的用R,SQL执行一些指令就能得到我们想要问的问题的答案,甚至一般人用简单的excel就可以得到很多的信息了。对比之下可视化设计周期长,开发成本高,为什么还是有这么多人前仆后继的利用它,去推销它呢?
我举一个例子,超级计算机有很多内核,没个内核之间相互协调完成很多分工中的一个小模块,那么会出现问题是,有的内核负责的工作比较多,有的内核负责的工作比较少?到底是哪写内核工作的比较多,为什么?你可能一下觉得拿出当初设计的图纸一看不就明白了吗?但是,问题来了,设计这些东西的模型太过复杂,已经没有人知道怎么去理解,超级计算机里面是怎么协调运作的。现在要怎么办才能提高计算机的运行效率呢?(超级计算机跑一次要花很多钱的)没有人知道该怎么办,只知道,在运算过程中有一些内核之间的协调数据。怎么办?????你问传统的数据分析员怎么办,他们会说数据之间的关联系太复杂了,他们也不知道建立什么样的模型去分析。这种情况下,我们只能见数据用可视化的形式呈现出来,看看数据里面到底有什么。这个就是当下数据分析很流行的exploration data anlysis(探索数据分析)。
所以我们可以看到,现在很多的数据总量太大,数据里面的关联性太复杂了。没有人知道数据里面的东西是什么,但是这些数据又特别重要我们需要认知和认识这些数据做出更好的决定,节省成本。这个也就是可视化的价值所在。在未知的情况下去帮助人们探索数据,提出问题,找寻答案。在计算机飞速发展的现在我觉得复杂的数据只会越来越多,需要用到可视化的地方也会越来越多。
传递媒介
可视化有两个很重要的价值一个是exploration,一个是explaination.就是探索和解释。但是更多的价值体现在探索上面,不过很多媒体也开始将他看做是信息平面设计的下一个平台。所以可以看到很多人开始利用可视化去传递社交媒体,新闻的数据,更好分让大众快速理解数据里面的信息。
不过还是有有一点要强调,可视化是数据分析的一部分,不是独立于数据分析存在的。
另外推荐一篇Jean-Daniel Fekete(傅可青)写的一篇文章 the value of information visualization里面在辩证信息可视化的价值,讲的要比我之前提到的更全面的多。