来源于:TalkingData furion推荐
作者:高晓津
目标人群:适合之前工作不需要自己上手做分析、或者对付这么大量数据的少数群体。
学习预期:七周下来之后只能是会,但不是掌握,工作当中常用的问题可以熟练应用。
学习时间:每周5-10个小时。
材料来源:这个学习计划以一位小米的游戏分析师版本为基础,根据零售的特点和需求以及自己使用下来的经验做了调整。
学习原则:分析只是方法,思维、逻辑、业务影响更为重要。我们是菜鸡,时间有限,不走fancy路线,工作用什么我们先学什么。
第一周:Excel
Excel函数:https://zhuanlan.zhihu.com/p/23345231
主要简单讲解常用的函数,以及与之对应的SQL/Python函数。
Excel技巧:https://zhuanlan.zhihu.com/p/23618955
主要讲解有性价比的功能,提高工作效率,养成一个好习惯,不要合并单元格,不要过于花哨。表格按照原始数据、加工数据,图表的类型管理。
Excel实战:https://zhuanlan.zhihu.com/p/24084300
主要将前两篇的内容以实战方式进行,简单地进行了一次数据分析,每个task一定要练熟。数据源采用了真实的爬虫数据,是5000行数据分析师岗位数据。
附加一道练习题,给1000个身份证号码,描述里面有多少男女,各省市人口的分布,这些人的年龄和星座。(身份证号码规律可以网上搜索)
下面是为了以后更好的基础而附加的学习任务。
了解单元格格式,后期的数据类型包括各类timestamp,date,string,int,bigint,char,factor,float等。
了解数组,以及怎么用(excel的数组挺难用),Python和R也会涉及到 list。
了解函数和参数,当进阶为编程型的数据分析师时,会让你更快的掌握。
了解中文编码,UTF8和ASCII,包括CSV的delimiter等。
第二周:数据可视化
经典图表及展示目的:https://zhuanlan.zhihu.com/p/24168144
报表制作:https://zhuanlan.zhihu.com/p/24409555
第一周数据BI实战:https://zhuanlan.zhihu.com/p/24573880
PPT:http://study.163.com/my (或者下个app,网易云课堂) 用户名:15001023438 密码:passw0rd;注意是数字0。
里面有我的学习-【我懂个P】,从头开始看,做个好PP。
第三周:分析思维的训练
金字塔原理、麦肯锡思维、SMART、5W2H、SWOT、4P理论、六顶思考帽等框架都是大巧不工的经典。网上搜咨询公司的面试题,搜Case Book。题目用新学的思维导图做,先套那些经典框架,做一遍,然后去看答案对比。
如果这些思维方式都很熟练了,利用以下两篇文章做个温习。
麦肯锡思维:https://zhuanlan.zhihu.com/p/24773022
数据分析思维框架:https://zhuanlan.zhihu.com/p/24887013
统计学和数学的基本概念:李航的《统计学习方法》。
第四周:数据库学习
数据库入门:https://zhuanlan.zhihu.com/p/25120684
W3C教程:http://www.w3school.com.cn/sql/index.asp
SQL是数据分析的核心技能之一,从Excel到SQL是数据处理效率的一大进步,W3C是用下来可读性最高的。学习围绕Select展开。增删改、约束、索引、数据库范式均可以跳过。主要了解where,group by,order by,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。如果想要跟进一步,可以学习row_number,substr,convert,contact等。另外不同数据平台的函数会有差异,例如Presto和phpMyAdmin。
SQL进阶:https://zhuanlan.zhihu.com/p/25435517
有时间网上刷题,可以根据后续工作提前准备好SQL语句,让熟手帮忙改,而不是直接让别人帮忙写好。
第五周:统计知识学习
这一周努力掌握描述性统计,包括均值、中位数、标准差、方差、概率、假设检验、显著性、总体和抽样等概念。详细的数学推导不用细看,只要看到数据,知道不能怎么样,而是应该这样分析即可。
Excel中有一个分析工具库,简单强大。对列1的各名词做到了解。如果是多变量多样本,学会各种检验。
第六周:业务学习
主要内容为财务、营销、顾客关系管理、顾客决策流程、用户行为、渠道、线上线下运营。
因为是业务出身,这周的内容我没有学。建议非业务去看目前服务于该客户的供应商产品以及市场上的竞品,了解他们用什么,能摸出来他们关注什么。Demo是很好的资源。
第七周:Python学习
编程学习说简单不简单,说难也不难,因为我们是菜鸡,所以学的方向比较单一,不会像廖XX的网站上一样挂出对联那么长的名目。需要学会条件判断,字典,切片,循环,迭代,自定义函数等。知道数据领域最经典的包Pandas+Numpy。
Python入门:《深入浅出Python》
我用的是Anaconda,代码一定要自己写一遍。
这部分我的操作和学SQL不一样,是让专家先写了差不多二十段工作当中常用的代码,然后自己按照之前学的基本原理愉快地
剪切、复制、粘贴、抄袭。
后期还可关注SPSS和爬虫。
经典图书推荐:《概率论与数理统计》、《统计学》推荐David Freedman版、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用 》、《Excel 2007 VBA参考大全》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。