数据可视化基础——视觉编码

本系列「数据可视化基础」文章共三篇，介绍可视化中最基础、最重要的一些概念、理论。这篇为第三篇，主要介绍视觉编码，另两篇则主讲可视化流程和数据模型，建议从可视化流程看起。
原文地址：http://geekplux.com/2017/01/03/basics-of-data-visualization-visual-encoding-principles.html

终于来到了最后一篇，前两篇的铺垫可能有点长，但是不种苗浇水怎能开枝散叶。可视化编码是可视化中的核心内容，本文会对其进行详细的讲解，尤其是视觉编码与视觉通道两个概念，如果其中遇到晦涩之处，不要心急，可囫囵吞枣直接往下看。

什么是视觉编码（visual encoding）

很多人可能看到题目的时候就有这个疑问，到底什么是视觉编码。其实视觉编码很简单，用一句话就能概括：

视觉编码描述的是将数据映射到最终可视化结果上的过程。

这里的可视化结果可能是图片，也可能是一张网页等等。

编码二字，如果说编是指设计、映射的过程，那么码呢？码其实指的是一些图形符号。

图形能告诉我们什么

在介绍各类图形符号之前，我们先谈谈：图形能告诉我们什么。

仔细观察上方这个简单的图片，你能得得到什么信息？

A B C 是不同的
B 在 A 和 C 的中间
BC 的长度是 AB 的大概两倍

得益于我们视觉系统的强大，这些信息不假思索就能得出。如果把上图想象成一个二维坐标系，则我们可能得出更多的结论。

"Resemblance, order and proportion are the three signfields in graphics.” - Bertin [1]

图形符号和信息间的映射关系使我们能迅速获取信息。所以我们可以把图片看成一组图形符号的组合，这些图形符号中携带了一些信息，我们称作它编码了一些信息。而当人们从这些符号中读取信息时，我们称作我们解码了一些信息。

我们人类解码信息靠的是我们的眼睛、我们的视觉系统。如果说图形符号是编码信息的工具或通道、那么我们的视觉就是解码信息的通道。因此，我们通常把这种图形符号<——>信息<——>视觉系统的对应称作视觉通道。

至此算是把视觉通道、视觉编码这两个概念讲清楚了。如果一个人说他想用四个通道来编码四个维度的数据，即可以翻译成他想用四种图形符号来对应这份数据表的四个列的信息。

这里举个例子（例子来自于 [2]陈为沈则潜陶煜波. 数据可视化[M]. 电子工业出版社, 2013.）：

例子来自于陈为沈则潜陶煜波《数据可视化》

上图中图 A 表示了三个不同班级的数学平均分，用柱状图表示，柱状图的高度作为一个视觉通道，编码了数学平均分的值；柱状，这个形状作为一个视觉通道编码了数学平均分这一属性。
图 B 中，我们想在 A 的基础上多展示语文平均分这一项数据（即增加了一个数据维度），则选用点这个形状通道编码这两个属性；点的横坐标编码语文平均分的值；点的纵坐标编码数学平均分的值。
这时候发现图 B 中我们把班级这个数据维度给丢掉了，于是我们可以用颜色这一视觉通道来编码班级这个属性信息，如图 C。
如果我们还想展示班级人数这一信息，则可以用尺寸这一视觉通道来编码，如图 D。

视觉编码中常用的视觉通道

1967 年，Jacques Bertin 初版的《Semiology of Graphics》一书提出了图形符号与信息的对应关系（就是本文上一节的内容），奠定了可视化编码的理论基础。

Bertin J. Semiology of graphics: diagrams[C]// Conference on Computer Networks. 1983.

如上图所示，书中把图形符号分为两种：

位置变量：一般指二维坐标
视网膜变量：尺寸、数值、纹理、颜色、方向和形状

以上基本的图形符号共有 7 种。将其映射到点、线、面之后，就相当于有 21 种编码可用的视觉通道。后来人们还又补充了几种其他的视觉通道：长度、面积、体积、透明度、模糊/聚焦、动画等，所以可用的视觉通道其实太多了。

而一般一份可视化作品可用到的视觉通道要尽可能得少，因为太多了反而会造成我们视觉系统的混乱，使我们获取信息更难。于是这就涉及到了视觉通道的设计原则。

视觉编码设计原则

这一节其实可以单独再分一篇文章写，因为可视化编码设计实在是复杂：假设我们有 k 个视觉通道，有 n 个数据维度，则一共有 (n+1)^k 种编码方案……从中选出一种最佳方案难度可见一斑。

不过既然本文是讲解视觉编码相关，所以这个章节是逃不掉的，在此提纲挈领讲一下。如果想深入了解，可以阅读参考文献中提到的书籍。

视觉通道的三个性质

上一篇数据模型讲解了可视化中数据分为三类：类别型、有序型、数值型。

定性性质（或叫分类性质）。适用于类别型数据。比如形状或颜色，这两个视觉通道，非常容易被人眼识别。从一堆正方形中识别出一个三角形，或看万绿丛中一点红，都是我们眼睛拿手好戏。
定量性质或定序性质。适用于有序型和类别型数据。比如长度、大小特别适合于编码数值/量的大小。
分组性质。具有相同视觉通道的数据，人眼也能很快识别出来，将其归为一组。

总结一下视觉通道与数据类型的对应关系，如下图所示：

视觉通道与数据类型的对应

视觉编码设计的两大原则

Mackinlay[4] 和 Tversky[5] 分别提出了两套可视化设计的原则，Mackinlay 强调表达性和有效性，Tversky 强调一致性和理解性。两者可以糅合起来：

表达性、一致性：可视化的结果应该充分表达了数据想要表达的信息，且没有多余。
有效性、理解性：可视化之后比前一种数据表达方案更加有效，更加容易让人理解。

下面这张图总结了视觉编码面对不同数据类型的优先级：

视觉编码面对不同数据类型的优先级

如果要具体展开每项视觉通道来说，未免有点太繁琐，而且设计可视化编码除了视觉通道还需要考虑：

色彩搭配
交互
美学因素
信息的密度
直观映射、隐喻

以上每一项都很重要，之后有机会再写吧。这个可视化基础系列总算是完结了，文字虽然不多，但是搜索资料、读论文、总结等还是挺累的，希望你能有所收获。欢迎各位在我博客文末留言讨论（如果看不到评论框可能是因为你没有科学上网）。

参考文献

[1]Bertin J. Semiology of graphics: diagrams[C]// Conference on Computer Networks. 1983.
[2]陈为沈则潜陶煜波. 数据可视化[M]. 电子工业出版社, 2013.
[3]CSE512 Data Visualization (Spring 2016)
[4]Mackinlay, Jock. Automating the design of graphical presentations of relational information[J]. Acm Transactions on Graphics, 1986, 5(2):110-141.
[5]Tversky B, Morrison J B, Betrancourt M. Animation: Can it facilitate?[J]. International Journal of Human-Computer Studies, 2002, 57(4):247-262.

本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。

最后编辑于：2017.12.05 06:24:46

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,132评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,802评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,566评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,858评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,867评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,695评论 1赞 282
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,064评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,705评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,915评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,677评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,796评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,432评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,041评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,992评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,223评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,185评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,535评论 2赞 343