两篇文章发布时间很接近,可见Tableau是多么简单易用。
先解释图片内容,依然是2015年重点城市全年的空气质量情况(用同一个数据源的还有这两篇:2015年全国368个城市空气质量指数可视化
和用Tableau展示的2015北京空气质量指数汇总图),不过这次展示的角度不同——用了三个指标:全年平均指数、日均指数和重点城市污染指数。
全年平均指数是一个概览,用一个地方全年指数总和/天数,粗略计算出平均值。可见污染严重的地方主要集中在华中一带。
其次,加入时间概念的是日均AQI,可见空气质量的季节性影响因素。
最后关注重度污染天数(即污染指数在300以上的天数),这里我的数据居然给到没想到的答案——和田和伊犁地区重度污染天数还挺多——这个有待考察。
Tableau好在界面丰富~
以下是Tableau的急速入门:
一句话来说,可以当做是Microsoft Excel的绘图专用版。
1、数据源
可来自本地的Excel、Access、文本文档等,或者链接到外边的数据库,兼容性超强。不列举了,看图:
数据源有了,开始导入吧!等等,需要注意的是,导入你的数据源之前最好做个清理,因为Tableau主打的不是数据清理而是成像啊~当然它内部也能对数据做一些简单删选、计算,但没有如Excel之类处理起来那么顺手。所以最好导入的数据源是清理过的,比如首行已经是字段名,地理信息补全,日期字段已经转换成日期格式。
导入数据源之后,点击你需要做分析的表(比如一个Excel文件簿的Sheet2)。接下来Tableau会自动识别每个字段的属性,主要有:字符串、数字、日期&时间和地理角色,有时候它会识别不准,需要你手动去调节——比如地理信息它识别成字符串,之后你想生成地理信息图就会出错,你需要了解数据源的属性、并根据你的分析需求对应到Tableau的属性(就是下图中小地球那一行内容)。对应不需要进行展示的字段,可以隐藏(跟Excel真是如出一辙!)
2、工作表,仪表板
数据源设置好属性后,根据你需要分析的字段,拖拽出来到“行、列”位置,Tableau会自动新建工作表(可以简单理解为Excel的 sheet)(这里跟数据透视表很像),之后你的图表就是基于这个工作表生成啦!你可以根据不同分析角度拖拽不同字段出来生成不同的工作表,再基于这些不同的工作表你就能生成不同内容的图表啦!
讲到这里,Tableau的基本元素和关系就出来了,数据源是数据库,工作表是主题数据库,同时它也能做展示,仪表板便于你吧不同主题的数据表(或图)拼接到一块儿,做整体展示。
3、故事书
这个有点像PPT……我真的没有在黑Tableau。
也就是你要展示一个宏大的主题(不一定宏大啦,小主题也行),需要有一个讲故事的心态,有综述、分说和总结、预测(故事线)。故事书就是帮你整合你的数据和图表的。它能插入图片、简单排版,利于你展示。
4、没了。其他细节我觉得跟学Excel的透视表、透视图、图表没有差别,自己摸索。
我看过的资料:Coursera课程:Fundamentals of Visualization with Tableau——加州大学戴维斯分校,英文的,中文的话看优酷一位名为SpiderManFor的up主po的大概五集、每集十来分钟的视频,不行还有Tableau的官方教学视频。
Tableau是要收费的,一千多吧,我没买,是试用的,一次注册试用有效期为15天(学习来说够了)。以后进公司了再申请来用(如果公司有资源的话)。工具而已,真的不需要dive into,除非有人给你钱。
以上,希望对你们有帮助。