接近年关,又到了一年复盘和规划的时候。除了微观层面上对自我工作进行总结计划,同时从宏观层面上看看我们目前在这场Data-Driven 或者Big Data潮流中的所处于的位置,提前为未来的变化做好准备。本篇文章仅仅代表个人观点,与公司立场无关。因为个人视角总会有所局限,也希望和大家有更多讨论。
我在这一年里面接触了各式各样的企业。其中一些企业已经张开双臂积极迎接从IT-Centric到Business-Centric的转变;一些企业仍然在门口徘徊不前,踌躇张望;当然,也有一些企业采购了新的工具,但是依新酒瓶装旧酒。从整体上来看,我认为2016年是自助式分析已在国内崛起,这场崛起中机遇与风险并存。这篇文章主要会结合Garner近几年里关于该话题的报告,BI领域产品的迭代创新方向等内容来谈。文章最后会分享此篇文章内引用内容的链接。
一、自助式分析的崛起
1.1 矛盾越来越强烈,源于业务方的需求
越来越多源数据,越来越复杂多变的业务场景,传统瀑布式的BI开发流程不能满足当下的业务需求。主要的矛盾点体现在三个方面,从业务人员角度来说:一方面和IT或者分析师沟通成本高,一方面需求满足时间久。从数据分析师的角度来说:因为业务的需求不能被IT及时满足,业务分析师变为业务部门的提数机器,没有精力去探索挖掘更有价值的数据信息。
1.2 基础数据模型固化与计算能力提升,让自助分析行为成为可能
当然市场里仅仅有矛盾和需求还不足够,仍然需要有供给让这一行为变得可能。随着越来越多的基础数据模型固化,例如Tableau将人们常用的维度和度量的组合辅之字段类型,给到用户散点图、折线图、树状图的智能推荐;例如alteryx中将R语言常用的算法模型进行了打包组件化,使用者只需要拖拽就能够完成一个预测分析。再从计算能力上来说,往往我们在本地电脑上打开一个上十万的Excel文件就已经痛苦不已,到如今你可以在自己电脑上处理到千万级别的数据。计算能力的提升也使得用户的需求能够更好被满足。
1.3 权威第三方的趋势判断与评测
此外,Garner早在2015年2月就在文章里预测了这一趋势,说道:“Traditional business intelligence (BI) and analytic models are being disrupted as the balance of power shifts from IT to the business.传统的BI产品格局在因为IT去中心化,以业务用户驱动的转变中发生剧烈震荡”,包括在今年年初发布的BI产品魔力四象评价中更突出了该变化。并且Gartner预测,到2017年企业里面绝大部分的业务用户,将会使用自助分析工具来处理分析他们的数据回答业务问题。
二、自助式分析的机遇
2.1 对于企业的机遇
更多人:大数据平民化
自助式分析将会促成企业更多人能够接触并从数据中挖掘出价值,换一个角度说,也就是这些年常提的大数据平民化。大到公司战略小到一个简单的推广渠道判断,让数据讲话,不再拍脑袋做决策。
更快速:拖拽性操作简单快速
当下的BI产品,无论是做数据准备还是到可视化,基本上都可以通过简单拖拽方式进行使用,并且产品本身也有一些固化的模型和推荐,让用户的从获得数据到得到洞察变得更快速.
更深入:更深挖掘数据价值
业务人员可以自助回答问题后,将数据科学家和分析师从日常业务问题的琐碎事物中脱身,从而有更多精力放到数据探索和挖掘的项目中。
2.2 对于个人的机遇
那这种自主数据分析的崛起,对个人而言的要求有哪些呢?毫无疑问它降低了我们人员的技术需求,但是却对于我们识别、判断问题和解决问题的能力提出了更高要求。拿我比较熟悉的两个产品来说,Tableau的使用很容易,的确是拖拽甚至双击就可以把数据的计算结果以可视化的方式呈现在我们的视野里。然而,我们却绝大时候发现,当我们把各路的报表简单的拽到一个仪表盘上后,信息依旧是凌乱的散落在一个个可视化视图里。再到Alteryx,它的使用可能更简单,就是拖拽组件搭成工作流,产品功能不再是你处理数据里需要花很多时间去学习的瓶颈,真正的瓶颈是你用一个怎样的逻辑搭建这个工作流,同样一个input 和output data,可能只需要四五个组件工作流搞定,同样十几个组件的工作流组件也能搞定。我在下方列出了一些能力要求及变化,供大家参考:
技术能力:SAS,Python,R等coding语言不再是瓶颈
统计模型:模型使用不难,不同问题的模型选择成为瓶颈
业务能力:识别业务问题,判断优先级是瓶颈
可视化能力:数据可视化不难,但要会用图表讲故事是瓶颈
解读与应用:最关键的环节,要求很高
三、自助式分析的风险
3.1 企业内部缺乏相关培训
记得以前看过一个研究说,企业的组织、人员能力配备等方面往往总是赶不上技术的变化。在这场变革中,我们也发现了这样的现象。在引入自助分析上,第一步就是要找到合适的人群并且组织结合实际场景的培训。在开始阶段,业务人员需要花费额外的精力来掌握自助分析新工具,如果缺乏合适的引导和培训,也许因为产品使用场景错误,例如把可视化产品用作了数据处理产品。反而会在自助分析的推进中适得其反。
3.2 没有认真甄选使用人员
其次,在自助分析文化推进的关键,还要特别特别注意甄选前几批使用人员。业务人员总会在技能,背景素质,包括对企业内部数据驱动的理解和驱动方面有所差异。认真甄选第一批种子客户,小规模的进行推广做出最佳实践,之后再到公司范围内的推广会更加顺风顺水。
3.3 数据管理问题暴露
假设这样一个场景,一个刚刚上任的总监需要从多个角度和层次去了解目前公司的销售问题,而IT部门却没有办法快速提供这样的报表内容,于是业务运营人员使用自助分析工具快速完成了报表制作,一天后就给到总监一个满意的答复。但是一个月后,总监依旧通过这张报表了解经营状况,却发现一些数据和实际经营情况对不上,于是叫来业务人员追查原因。业务人员发现在自助分析端并没有出现过调整,于是再从数据源的角度做问题排查,因为他在数据源链接中使用了Salesforce,Google Analytics,Excel,MYSQL数据库里面不同的数据源,也就意味着不同数据源需要一一排查。花了几天的排查后最终发现那张从MYSQL数据库里的表已经好一阵没有更新了。原因在于因为IT接入了新的业务系统后,创建了新表来替换原始的那张表,但这个信息并没有及时通知到给业务部门。换一个角度,这件事情暴露了企业的数据管理制度安排没有跟上自助分析推广的变化。另一方面,也体现了对于适用于自助分析下的数据管理工具的需求,后文谈未来的模块会另外介绍。
四、自助式分析的未来
1 数据准备
自助分析最先以数据可视化的姿态进入到人们的视野,业务人员拿到处理好的数据进行可视化分析,一些数据准备的工作仍然掌握在IT部门的手中,或者是业务人员自己费时费劲的手工处理。但往往一个数据分析项目里,将近有80%的时间花费在数据准备融合的工作里,如何能够真正加速这个环节也将成为提升业务人员工作效率的关键。Gartner预测在2017年将会越来越多的企业将把数据准备内容纳入自助分析的模块中,与此同时,各大厂商也开始进军到数据准备的领域。例如:Tableau在2016用户大会上正式对外宣布了自己的数据准备产品项目,很有可能在明年就和大家见面。Talend也推出了自己做数据准备模块的产品。
2 数据管理
如上文风险模块中所说自助分析推广也将对企业内部数据管理提出更高的要求。传统的数据管理以政策法规驱动,IT为中心的来做统一的管理。而在自助分析中,将需要解决的两个重要的数据管理问题:1. 在各种各样的数据源中如何快速获取到准确的数据。 2. IT如何更好的和业务协作。数据管理方面也有一些新兴的产品,如自称要做数据查找领域的Google的Alation,将统计和机器学习运用在数据搜索之中,比方说用户如果需要寻找 shipment date这个字段,直接输入即可,并不需要输入数据库的字段名字(shp_dte)。同样,针对于不同人群的搜索,可能返回结果也不同,HR和CRM都输入comp这四个字母的时候,HR得到的提示为compensation,而CRM可能就是Compliant。在IT和业务方面协作方面,Tableau用户经常会在ad-hoc分析时候创建某些计算字段,而未来IT可以在背后看到用户创建计算行为的数据,再通过简单拖拽或者其他方式将常用的计算字段固化到原始数据源。
3 运用更强大的处理能力
提升数据处理能力主要从两方面来提升:一方面是更好利用分布式计算的能力。例如Bluedata提供了企业更简单便捷的大数据部署的解决方案,数据分析师或者数据科学家可以更自助而简单的部署计算任务。另一方面是强化自身产品的数据引擎处理能力,如Tableau 收购了Hype data engine。
4. 组织内或者行业性的知识沉淀
因为企业内部更多用户使用自助性的平台进行数据分析洞察,平台性的存在也让企业内部的知识沉淀和协作变得更加可能,想象下你可能是个新入职的员工,不清楚新公司的数据情况,不清楚自己当下部门里使用这些数据时候都在做哪些分析。但是当你打开这个分析平台界面,你就能够看到你们部门都在用哪些数据,哪些数据有过权威人士的标注,包括这些数据表之间平时如何关联应用,成品仪表板的样式等等。
最后,引用一段Harvard Business Review 对这一转型趋势评价的一段话:“We’re in the middle of a significant shift in the way organizations blend and analyze data, affecting not only the way decisions are made, but also how businesses operate. Data analysts in the line of business, who formerly had no choice but to rely on highly skilled, highly paid data scientists for data access, can now take advantage of self-service technologies to achieve analytic independence. These technologies enable practically anyone—regardless of their technical proficiency—to be a data analyst and make data-driven business decisions.”
我们当下站在一个企业使用分析数据的转折点上,该转变不仅仅会影响企业的决策方式,也将影响业务的运转方式。众所周知,数据分析这件事情应该和商业结合的更紧密,然而这件事却因为需要各式各样的技术使得我们不得将业务和分析这样两个环节割裂进行分工。而现如今,得益于技术的发展让我们每个人不再会因为技术而成为我们使用数据的瓶颈,从而实现真正的数据驱动企业决策。
本文参考内容:
1.http://www.tableau.com/zh-cn/node/63220?from=timeline&isappinstalled=0
2.http://mp.weixin.qq.com/s/AlgTI1gPg9_apXsREFJ8bg
3.https://www.tableau.com/sites/default/files/whitepapers/enabling_governance_for_insight_0.pdf
4.http://www.gartner.com/newsroom/id/2970917
5.http://blogs.gartner.com/merv-adrian/2016/10/19/symposium-notes-day-two-jumps-in-the-data-lake/