面试官问:“你用Excel作图熟练吗?”,先别急着回答,文中的一些作图细节,或许会成为你回答“熟练”的致命伤。不管如何,一个专注细节,追求卓越的分析师,才有可能不是“昏析师”吧~
(本文所使用的数据都经过脱敏处理,其数值不具备参考价值)
敏锐地缩放坐标轴
观察图样例1.1,绝大多数人的注意力都会集中在红圈所指示的波动变化上。某生鲜电商用户的连续购买天数分布,为什么在1月份测算时的5天,3月份4月份测算时的10天,出现一个高峰?答案其实很简单,因为1月份之前,一直有连续购买5天有折扣的活动;3月4月则改成了连续购买10天有折扣。所以许多用户会为了折扣而连续购买,而且这样的运营活动,带来了正向的拖尾效应,即连续购买6天7天的用户也要多于3天4天。这是一个很有意义的信息,但此文并不讨论。
我们要问的是,15天以后的线图真的非常平缓,不需要观察吗?答案是否定的。因为我们的纵坐标轴的range取得过大,导致后面的信息被掩盖了。因此,我们需要放大坐标轴。
如题样例1.2,放大坐标轴后,连续购买超过30天的高粘度用户,在1月、3月和4月其实是有显著变化的。3月、4月,连续购买超过40天的高粘度用户,明显少于1月份。高价值用户在流失,这对于一个细分市场的电商,可是重大警报。所以,适当的时候,放大坐标轴,才能不遗漏关键信息。放大坐标轴的设置如下图:
调整坐标轴标签的位置
有些含有负值的数据图,横坐标的标签覆盖住负值,显得很丑陋。解决这个问题,只需要设置“标签位置”为“低”。
突出显示关键节点
当某些数据点特别重要时,需要突出显示。如最大值、最小值、均值等。如上图1中箭头所指,你需要点击选中单个数据条,然后右键单独设置它的填充色等参数。
次坐标轴与网格线对其
经常会看到某些“官方渠道”出的报告,犯了和样例3.1的2中一样的错误。即次坐标轴与主坐标轴的网格线是错开的。正确的次坐标轴设置应该是区间取(0-84%),间隔取12%;也就是主坐标轴7个间隔,次坐标轴也7个间隔。
利用填充色的透明度
填充色的透明度,可以很好的弱化一些信息,尤其是当你要突出图表中的某样数据时,其他数据的呈现就可以提高透明度。
我们这里介绍一种透明度的奇葩用法,利用散点图点的透明度,来做出“热力图”的感觉。即当数据样本量较大时,每个点的透明度设得极高98%,这样所有点汇集后,点密集的区域,由于透明度互相叠加,色彩就更浓了。这个方式很能挖掘一些隐藏信息。
如图样例4.2,10块钱的订单分布在很长的一个时间区间当中,且10元下面的区域出现空白;说明很多单价本应该在8-9.9块的用户都会选择订购到10块钱。这是为什么呢?10块钱免邮?还是人们就愿意凑个整数?
活用趋势线
Excel图表中的趋势线是我个人非常喜欢的功能,尤其是在观察时间序列数据时。趋势线的形式可以选择线性、指数、移动平均等多种。如样例6.1,通过趋势线,我才能判断出三个变量的变动方向。具体点说,绿线所代表的这家网店的客服响应率其实是在下降的,而且其平均水准已经将至蓝线所代表的网店之下了。
(这周的内容准备有些仓促,先讲到这里,Excel中的作图问题,有很多经验可以谈,以后会慢慢整理出来。祝大家新的一周工作顺利!~)