在tableau中,我们的目标是使数据分析成为一种愉快的行为。
一些朋友用户经常讲到,当他们沉浸在软件的操作中,已经忘记了产品问题,而集中关注子在数据背后揭示的故事。这个可以叫做experience flow,是一种沉浸在工作中的喜悦状态。
与此同时,还有一个你一定遇到过的情况。有时,你遇到了一个问题,其实是很容易描述清楚的,但当你试图在tableau中展示并回答,会发现它竟是很难的。此时,前文提到的experience flow,就没有了感觉,你需要开始思考如何解决问题,而不是集中在问题和答案。对于新手来说,这是郁闷的,他们遇到了困境不知道如何着手。
如上这些问题的核心是,数据,需要可以汇总到不同层级的数据。
什么是汇总?就是按照用户指定的数据列,对数据求和、求平均数、计数等等。
举例来说,要比较整个销售区域的平均订单规模与全球平均订单规模,你需要的是这几个数字:
订单数据的层级(即:你需要对每一个订单,做数值求和);
区域数据的层级(即:以区域为计算单位,求和);
世界范围数据的层级(即:以世界为维度,求和)。
对于所提到的不同的层级,tableau中的我们指的是“LOD”(“level of detail”)。这本质上是告诉我如何通过数据字段中的维度去对现有数据做聚合或解聚数据,它是由在即的尺寸确定。默认情况下,tableau将详细级别的数据去匹配图形界面的LOD(Viz LOD)。
如下图,对于左边的轴,从下到上是,详细级别和集合级别;对于右边的轴,从下到上是,颗粒密集到颗粒稀疏。
在tableau 9.0中,引入了LOD。支持定义到你所需要的任何层级。(如果不理解层级,单独写一篇818层级到底是什么意思),使你可以扎努注意分析内容,不要被处理问题二分心,回归experience flow。
LOD,一共有三种形式,INCLUDE,EXCLUDE,FIXED,后边我们一点点来揭开他们。他们的格式看起来像这样:
注意,蓝色部分看着熟悉吧,就是一个基本的数据聚合公式----求和。红色的部分是一个新的容器,它告诉tableau执行蓝色部分求和时,在哪个数据层级使用(喏,层级又来了,如果不理解层级的意思,后面很难读懂啊)。在如上这个公式中,告诉tableau在订单的层级,对销售额做求和,而不考虑视图使用的维度是什么。
下一篇下面详细介绍:INCLUDE