背景说明:最近做一个邮件任务发送的界面设计,其中有一个功能点是选择要发送的报表,现在的方法是报表名称平铺,没有对长度进行限制,对于一个极度强迫症患者很难忍受,好奇心驱使下想到可以算一下大多数用户命名的长度区间,现在就是这样平铺,字段名称太长还会溢出,-_-||
步入正题,开始取数、算数、满足好奇心。步骤如下:
- hive里面导出所有报表名称数据
- 计算报表名称的长度(excel完成,对于工具怎么方便就怎么用)
- 数据导入到Tableau,是预处理后的数据,如下图
- 创建计算字段
报表数:COUNTD([id])
百分比:RUNNING_SUM([报表数])/WINDOW_SUM([报表数]) - 创建参数,下图所示:
-
按下图所示拖入字段到指定位置,并且设置【报表数】条形图,【百分比】曲线
- 行上【百分比】字段右键选择“计算依据”-“表横穿”,且选择双轴。
-
对轴进行处理,左右轴上分别右键选择“编辑轴”,范围都是固定开始-0,独立
-
在横坐标和右轴上分别右键选择“添加参考线”
调整参数,查看字符区间。这个案例算出的18字符以下是80%,23字符以下是90%~
折腾这个图花费一些时间,实际还有个更好地方法进行探查,即表格,一目了然。
注:不存在表不如图观点,这个case表格更能达到自己的分析目的。并且我的目的是要算出字符串在多少区间比较合理,所以是横坐标上对字符长度升序排列而不是按报表数进行降序,如果是按下图一样,会无解。
public很久前放过一个帕累托的viz,貌似被我删了,也没备份,囧。。。后续重新补充。。。