Excel
表格按照原始数据(sheet1)、加工数据(sheet2),图表(sheet3)的类型管理
vlookup和数据透视表是极具性价比的两个技巧
数据可视化
数据分析界有一句经典名言,字不如表,表不如图。
Excel可以100%完成上面的图表,但这知识基础。后期的进阶可视化,势必会用到编程绘制,比如Python一行代码就可以完成常见的多元分析。
还有BI(商业智能,实际上就是省去了报表的工作,数据多了都会用BI的),BI和图表的区别在于BI擅长交互和报表,更擅长解释已经发生和正在发生的数据。将要发生的数据属于数据挖掘的方向。
数据可视化的学习就是三个过程:了解数据(图表)、整合数据(BI)、展示数据(信息化)
思维、框架、方法论
SMART、5W2H、SWOT、4P理论、六顶思考帽等框架。这些框架都是大巧不工的经典
数据思维是不断练习的结果
数据库/Python/R
Excel对十万条以内的数据处理起来没有问题,但是互联网行业就是不缺数据,但凡产品有一点规模,数据量都是百万起,这时候就需要学习数据库。从Excel到数据库是数据处理效率的一大进步
主要围绕着查询(Select展开学习)
虽然SQL+Excel足够应付入门级数据分析,但是涉及到循环迭代、多元图表的分析部分,复杂度就呈几何上升。更遑论数据挖掘这种高阶玩法,我相信未来了解数据挖掘的产品和运营会有极强的竞争力
统计知识
很多产品和运营相关的数据分析文章,没有多少提及统计知识。这是不严谨的。比如产品的AB测试,如果产品经理并不清楚置信度的含义和概念,那么好的效果并不意味着真正的好。尤其是5%这种非显著的提高。比如运营一次活动,运营若不了解检验相关的概念,那么如何去判别活动在数据上是有效果还是没有效果?
这里推荐一本书《统计数字会撒谎》,很多的数据分析决策并不牢靠。这本书讲的都是统计学最基本的常识,可是却往往被人忽视,值得所有的产品经理以及统计人员一读
业务知识(用户行为、产品、运营)
举一个数据沙龙上的例子,一家O2O配送公司发现在重庆地区,外卖员的送货效率低于其他城市,导致用户的好评率降低。总部的数据分析师建立了各个指标去分析原因,都没有找出来问题。后来在访谈中发觉,因为重庆是山城,路面高低落差比较夸张,很多外卖人员的小电瓶上不了坡…所以导致送货效率慢。
这个案例中,我们只知道送货员的送货水平距离,即POI数据,根本不可能知道垂直距离的数据。这就是数据的局限,也是只会看数据的分析师和接地气分析师的最大差异。
最后,和数据相关的岗位
数据产品经理(偏策划)
机器学习(偏统计)
市场分析师(偏商业)
大数据工程师(偏工程)