常有同学提问“面对这类问题,我该用什么模型?面对这类问题,我该用什么工具?”
其实,这就陷入了一个误区,把数据分析当成物理学。
在物理学中有严格的因果律和定律的可重复性。所谓严格的因果律,指的是,万事万物的发生都有原因,是原因导致了结果。定律的可重复性指,一旦得出一个定论,那这个定论是可以重复的。就像根据万有引力定律,我们可以推出,无论何时何地,无论是谁,只要向上扔苹果,苹果一定会落下来。
但在数据分析中,不存在严格的因果律和定律的可重复性。每一种场景都被千千万万的因素影响。没有一个法则是万用的、一定能保证成功的。因而,进行数据分析不存在面对某种问题就用某种模型或某种工具的定论。如果这些定论存在的话,AI就会代替所谓的“数据分析师”。
所谓数据分析师,不是搬砖工,数据分析师需要自己去思考如何分析。毕竟如果连思考的环节都由人代替,那仅仅只是个操作工。
因此,作为数据分析师需要做的就是:
得到数据后,思考怎么去了解这个数据,然后理解业务需求,从而完成整个项目
具体的方法是:
步骤一:在理解数据背景的基础上,提出基于事实的假设
步骤二:然后进行相应的数据收集,定制相应的分析策略
步骤三:证实或证伪假设
分析的思路和想法基于问题是灵活变通的,没有一门课程能够传授一副包治百病的“灵丹妙药”。想要成为数据分析师,不能指望存在一种万能的钥匙、寻宝的地图,而要设身处地的独立思考。
作为观察数据、分析数据的人,当然要去尽力总结、发现规律、学习借鉴,但是,要记得不要把数据背后的事实当做物理去研究。我们不可能按照总结物理定律那样总结数据规律,并且希望之后可以原封不动的重复很多遍。
分析思维的积累是在不同难题中磨练的,而这些难题不就是数据分析的美妙之处么。
#数据分析不是套用公式#
#数据分析不是物理定律#