2017年数据分析学习计划
前言
其实想写这篇文章很久了,一直在酝酿怎样写会更好一些。与其说是一篇计划书不如说是对过去的一些总结和对未来的期许。它是我下面执行的计划也是写给我自己看的一篇提醒。
大一时我是一名资环学院的学生,然而我努力了挺久并没有喜欢上我原来的专业。所以我选择了转专业,我去了软件学院。其实进入软件学院我也是比较懵懂,我并不是很了解这个行业。 转过来很多软件学院的学生很诧异,觉得他们很多人都想转出去,因为课程很难。随着进入软件学院学习,因为没有任何基础的原因我学的很累,常常需要熬夜,别人只上大二的课,而我还需要补修大一的课。回望过去我一直觉得我一直在忙忙忙,我一直在被各种deadline所追着。因为努力我也被老师看中参加项目,也跟着老师发表了两篇论文。而我一直没有找到我究竟喜欢什么?也没有深入地思考我究竟对什么喜欢?
为什么走向大数据这条路
今年我参加了高教杯的建模比赛,当时我们组选择的是B题,即开放小区后对道路交通影响的分析。对于交通规划我们其实是十分陌生,而我负责的是建立模型和进行数据分析。那是我当时第一次接触到数据分析概念,也试着用层次分析法对结果进行建模、分析。后来比赛结果出来我们拿了名次,也较为满意,我第一次对数据分析产生了兴趣。
大三了,很多人开始对未来进行选择,大部分人是按部就班上课,或者开始准备考研以及找工作,其实我自己也开始苦恼是去研究生还是去找工作为哪个方向做准备。
在一次偶然的机会我在知乎live中听了猴子老师的live《如何零基础从事数据分析》,同时也加入了群里,群里的人都积极向上,都很快地提出了自己的学习计划。我突然好像对数据分析觉得不再那么的恐惧,并不是老师和其他人说的那么神秘,我想迈出步伐去尝试一番。毕竟我还年轻,我可多去尝试一下。
学习基础
作为软院的学生,我上过数据库概论这门课,对数据库也有着一定的了解和基础,同时也有一些python的基础。我对数学也有着较大的兴趣。转专业的经历在对我来说的好处就是,我自己可以更快地去尝试和接受新的事物和知识,我对新的事物并不排斥。
学习计划
我觉得有方向的努力比无方向的努力更为重要,同时踏实、细化、可行的计划才是实现梦想的最低要求。我的计划如下:
-
紧跟猴子老师的live
第一部分:做正确事情的方法论
第1讲:零基础入门数据分析的方法论(2016年11月已讲)
第二部分:以正确的方式去实践
第2讲:数据分析基础:数据结构入门 (2016年12月份)
第3讲:如何读取数据 (2017年1月份)
第4讲:如何对数据进行预处理(2017年2月份)
第5讲:如何对数据进行信息提取(2017年3月份)
第6讲:如何对数据结果进行展示(2017年4月份)
第7讲:项目实战:如何做一个数据分析系统(2017年5月份)
第三部分:用知识去赚钱
第8讲:如何找到数据分析工作(2017年6月份)
第9讲:红利共享:社群成员众筹一个盈利项目(2017年7月份)
但是我也清楚的认识到仅仅跟着猴子老师师远远不够的,要想做的更好,需要
自学,自学,自学。重要的事情说三遍。
-
如何自学
我需要看的书如下:
R语言实战是我这次学习计划的主要书籍,其次的深入浅出统计学作为次要的书籍作为在学习R语言实战的时候遇见问题时进行翻阅和学习以及利用python进行数据分析是在实践的时候进行直接查阅和学习。
学习方法
-
对时间的反思
我不知道大家有没有这样的感受,感觉花了一天时间在某件事上,但是还是没有去解决完这件事。我有这样的体验。后来我为了探究为什么,我做了一次实验。开始做事就按下计时器,不是在做这件事情的时候就停止计时。后来我发现我的确花了一天的时间去做这件事,但真正放在这件事情上的时间只是3小时12分钟。这件事大大刺激了我的神经。所以为了保证我自己的学习时间和效率。学习时间的单位必须细化到小时。
所以我的计划是每天记录自己学习开销。并且以 5个小时为一个学习阶段。
-
持续输出
在此之前,我也曾经自学过linux系统,因为linux命令很多,常常是今天敲过了,然后几天没用就给忘了,又去翻书记一遍发现又忘了,最后只记得在书的哪个地方。
后来发现与其被动地去翻书,不如自己主动刻意地去问自己学了什么,能不能写出来,不能写出来再去记一次。刻意地复习总结的确是痛苦的,但是更有利于自己的提高。同时持续的输出可以有利驱动输入。
所以我的计划是在完成一个学习阶段任务的情况下,进行记录犯的错误以及可以进行总结的知识点。在写的过程中总结和查漏补缺,并且展示自己的学习开销。
-
如何降低入门的困难
其实最难得的时候就是入门的时候,我们可能觉得入门一样东西需要去知道好多的基础知识,不知道就不能去做,就不能做的好。然后因为这个我们就会觉得和登山一般,目标很累。
但是在看到XDite老师的概念后我觉得豁然开朗。(具体可以百度)
- 学习其实一个拼图的过程并不是登山的过程。学习要有成就感。
只要我们克服刚开始入门的恐惧感,我们就可以开始更好的深入学习。而不是就此放弃。
学习是需要反馈的,只有尝试了才知道难不难。在我们所知kaggle是一个很好数据分析的竞赛平台,我们可以从它的最低难度的训练营进行对自己的训练。同时也接受反馈。
在真的很累的时候其实可以“骗骗自己”,对自己说:“我其实就是玩玩,不是非做出来不可”。这样你就可以放松一些。就可以继续学习。
英语
现在中最新的知识一般是英文版是最好,在这个时代,我们需要更新自己的知识面,其实对于英语其实我也有些抗拒,但是想到coursera上那么多好的课程,我却因为英语的原因与其失之交臂我就觉得很可惜。所以我下定决心去学习英语。
总结
这是我今晚的一些粗浅的想法。对于计划我会继续努力更正和修正。猴子老师说:少就多,慢就是快。用,效果是最好的。
学期也将近结束,我将拥有接近两个月的假期时间进行实践和学习。我将努力执行计划,以上浅薄之见,希望大家指出不足之处。