在2015年,人类总共创造了4.4ZB(44亿TB)的数据,而这个数字大约每两年就会翻倍。
在这些数据中隐藏了各种关于消费习惯,公共健康,全球气候变化以及其他经济,社会还有政治等等方面的深刻信息。
可惜的是,虽然“大数据”成为了一个热点,但每年只有不到10% 的数据会被分析。
01 大数据+数据分析
- 数据量大,Excel容易卡死;
2. 几十万的数据计算要跑几个小时;
3. 拿不到需要的数据,分析时总是缺少关键元素;
- 不知如何做展示,看不到数据背后更多的信息;
5. 每周重复做报表、计算,数据要是能自己更新就好了;
6. 团队沟通成本高,数据更新快、文件版本多,容易出错;
- 新需求、新变动、急着要的数据,技术那边等排期;
……
02 如何让数据分析变得更简单灵活?
数据处理的工具虽然多,但大部分工具需要技术人员来操作,使用者必须有较高的IT能力。
又或者说,数据处理的软件为定制化的,当有了新的分析需求时,原有的工具已经不再适用,或者满足了。
以简单的数据分析为例。
** 柱状图 **
分析二维数据,用于比较。
A组产量与B组产量对比
** 堆积图 **
不仅可以直观的看出每个系列的值,还能够反映出系列的总和,尤其是当需要看某一单位的综合以及各系列值的比重时,最适合。
本周产量对比与总数
** 横版堆积图 **
显示各个项目之间的比较情况,和柱状图类似的作用。每个条都清晰表示数据,直观。
本周产量对比与总数
** 折线图 **
折线图可以显示变化的连续数据,非常适用于显示数据的趋势。
各小组之间产量对比
** 环形图 **
能够直接以图形的方式直接显示各个组成部分所占比例。
每台设备维修用时占比
** 混合图 **
既能展现柱状图,也能展示折线图,方便对比总结。
** 箱线图 **
它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。
** 柏拉图 **
将某一期间所收集的数据,按特定角度适当分类而依各类出现的大小顺序排列的图表。
柏拉图是分析和寻找影响质量主要因素的一种工具。
** 看板展示 **
图表组合成看板的效果
物联网软件将会可以从散乱的数据中识别并提取有关联的信息。而这种数据分析的能力将会从应用扩散到普通人手里。借助于ThingWorks平台,我们处理起巨量动态数据的能力将会逐渐提高。