一,学习方法 MAS
总结一下,就是他找到了高效的学习方法,我把它称为MAS 方法。
* Multi-Dimension:想要掌握一个事物,就要从多个角度去认识它。
* Ask:不懂就问,程序员大多都很羞涩,突破这一点,不懂就问最重要。
* Sharing:最好的学习就是分享。用自己的语言讲出来,是对知识的进一步梳理。
二,与数据建立多维度连接
怎么和数据分析建立多维度连接呢?我特意把内容分成了三个大类。
* 第一类是基础概念。这是我们学习的基础,一定不能落下。
* 第二类是工具。这个部分可以很好地锻炼你的实操能力。
* 第三类是题库。题库的作用是帮你查漏补缺,在这个过程中,你会情不自禁地进行思考。
这个连接的过程,也是我们从“思维”到“工具”再到“实践”的一个突破过程。如果说重要性,一定是“思维”最重要,因为思维是底层逻辑和框架,可以让我们一通百通,举一反三,但是思维修炼也是最难的。所以,我强调把学习重心放在工具和实践上,即学即用,不断积累成就感,思维也就慢慢养成了。
三,学习的模块
说到底,学习数据分析的核心就是培养数据思维,掌握挖掘工具,熟练实践并积累经验。为了能带给你更好的学习效果,我在专栏里设计了五大模块。
1. 预习篇
我会给你介绍数据分析的全景图,和你进一步探讨最佳的学习路径。我还专门准备了 3 篇 Python 入门内容,如果你还没有 Python 基础,希望能帮你快速上手,如果你已掌握了 Python,可以当作一个复习。这么安排是因为 Python 是数据科学领域当之无愧的王牌语言,很多数据分析利器也是基于 Python 的(再或者,你也可以购买极客时间上的“零基础学 Python”视频课程)。
2. 基础篇
我会带你修炼数据思维,从数据分析的基础概念,到数据采集、数据处理以及数据可视化。我们一起从数据准备的整个流程上了解数据的方方面面。
3. 算法篇
算法是数据挖掘的精华所在,也是我们专栏的重点内容。我精选了 10 大算法,包括分类、聚类和预测三大类型。每个算法我们都从原理和案例两个维度来理解,达到即学即用的目的。
4. 实战篇
项目实战是我们学习的一个重要关卡。我准备了 5 个项目带你真实体验。比如在金融行业中,如何使用数据分析算法对信用卡违约率进行分析?现在的互联网产品都进入到千人千面的人工智能阶段,如何针对一个视频网站搭建视频推荐算法?
5. 工作篇
我选择了几个大家最关心的职场问题,比如面试时注意什么,职位晋升路径是怎样的等等,助你一臂之力。
我希望,通过这个专栏,你将有如下收获。
1. 数据和算法思维
这不仅是在技术上的思维模式,更是我们平时看待问题解决问题的思维方式。如果你将数据视为财富,将数据分析视为获得财富的工具,那么在大数据时代,你将获得更宽广的视野。
2. 工具
用好工具,你将拥有收集数据、处理数据、得到结果的能力,它会让你在工作中游刃有余。
3. 更好的工作机会和价值
无论是当前火爆的人工智能,还是数据算法工程师的市场,都很看重数据分析和数据处理的能力。从“思维”到“工具”再到“实践”,沿着这个路径拓展自己的能力边界,拥有更强的竞争力。
在你面前,即将开始一场数据科学之旅。我们一起用 15 周的时间,从算法原理、分析工具和实战案例三个维度体会数据科学之美。
正式启程之前,我想邀请你聊聊自己对课程的期待,你如何看待数据挖掘和数据分析?你的工作和生活中有什么事情用到过数据思维吗?
写留言
精选留言
Hank_Yan
15
业务洞察是分析数据的前提,分析数据是理解数据的前提,理解数据是数据挖掘的前提。从业务到数据再到挖掘,每一步环环相扣,相辅相成。业务千变万化,规律亘古不变。期待老师提纲挈领,从整体思路点拨,用经典案例教学,让每一位学生学到真本事,共勉。
2018-12-17
作者回复
这位老师总结的也很到位
2018-12-18
Aggi
8
希望多讲一些分析的思维,以及和实际业务关联的案例的整个流程
2018-12-17
作者回复
这个没问题,专栏中重点就是告诉你如何使用这些工具,以及案例实战训练。当然你也会在案例和工具中,训练你的数据思维,以及对他们的认知
2018-12-17
别问
7
求推荐一些数据分析的书,谢谢。
2018-12-17
作者回复
思维:
《思维简史:从丛林到宇宙》
数据处理
《数据挖掘:概念与技术》
《Pentaho Kettle解决方案》
《精益数据分析》
《Small Data》
《利用Python进行数据分析》
2018-12-17
汪汪汪
6
本人是转行学习数据分析,想通过两个月时间自学,顺利拿到offer进入岗位进行实操。目前看了《深入浅出数据分析》那本书,然后学了python基础知识,想请问老师,接下来该如何开展学习计划。我想学python常用的几个库,从爬虫开始获取外部数据,熟悉常用的数据挖掘算法,最后花两个星期学习基础的SQL和excel操作。您的建议是什么?我手上的学习资源比较多,所以得重点筛选。期待老师的回信
2018-12-18
作者回复
多谢关注,1)首先从爬虫开始是不错的,这样你能感受到成长的过程。
2)数据挖掘算法,如果你想了解十大算法的话,理论部分你需要花一些功夫。当然这些在Python中都有类库可以使用。做练习的话,你也可以把这些算法都用一遍,然后看下哪个算法模型的结果更好
3)网上这方面的资源确实比较多,他们大多讲的是理论原理。我认为你更注重的在于实战,因为做项目不仅更有成就感,还能更好的让你理解这些算法、爬虫的原理。
我会在专栏里给你做个“专属题库”,对应爬虫、数据挖掘这些的题目,你可以做个评测,不明白的地方,我也会给你做讲解。
4)资料比较多,但其实不用每个都看一遍。尤其是理论的部分,看一遍就可以了。关键是把它抽出来做个思维导图,方便查询,这样下次看导图就能回忆起来讲的是什么。省时又高效!
2018-12-18
五岳寻仙
6
老师好!看到这个专栏很兴奋!对数据挖掘/机器学习很感兴趣,自学有段时间了,也接触了不少工具,但遇到具体问题还是很盲目,有下面几个方面的困惑:
1. 如何做好“特征工程”,没有思路,也没有思考方向,看了不少博客,所谓的技巧也都知道了,但遇到问题还是用不好;
2. 对于样本类别不均衡的问题,不会处理,尝试过下采样或过采样,但似乎改变了样本原本的分布,效果不太好;
3. 对各种机器模型输出的结果没有把控能力,搞不懂为何有时效果好,有时效果却很差。
因为没有人带,自学感觉很迷茫,希望能跟随这门课程提升自己应用能力。
另外,想请教一下老师,为了能更好地掌握经典的机器学习算法,有没有必要自己实现一遍?
2018-12-17
作者回复
感谢你的热情和关注,我认为非常有必要自己使用这些机器学习算法来解决实际问题。
当然原理可以采用伪代码的方式,把流程画出来即可。项目中,很多时候都是直接使用类库,所以你更应该关注的机器学习的效率和结果。
很多时候,我们在选择模型的时候,都要试,一次会用多种模型,然后看训练结果的好坏,再决定采用哪个模型。
特征工程,以及调试的过程其实就是经验积累的过程,很多时候调参数的时间,比你写程序的时间还要长。但是这个积累过程还是挺重要的,当你有了更多经验之后,这个“试”的效率就会提升!
2018-12-18
姜戈
3
之前一直在看推荐系统的内容,还没入门,就被各种算法搞得头大,浏览了课程安排,希望数据分析45讲让我对推荐系统的学习打下坚实基础.
2018-12-17
作者回复
其实实战是最好的学习,你可以在项目实战中体会这些算法,当然我也会给你讲解这些算法的原理。所以我安排了从“认知”=>“工具”=>“实战”的过程,并且会给你总结“思维导图”和“专属题库”帮你来巩固学习
2018-12-17
草莓味冰糕
2
我是一个想转商业数据分析与挖掘的生物学(生物信息方向)硕士研究生,很需要有一门课大概能告诉我一个算法或者数学模型适用于哪些商业或者运营的情景,这是我现在急需的,也是对课程的期望,哪些东西可以解决哪些问题,也希望作者能推荐一些类似的书,期望自己能在这么课收获很多,找到自己的路
2018-12-18
作者回复
我上大学的时候,也了解一些生物信息学的情况,非常能理解你的心情和想转到商业数据分析的决心。
我觉得需要从两个方面来下手:
1)工具角度:课程里讲的算法,你可以帮他当做是个工具。他的诞生是从数学原理开始,形成的理论模型。
这些模型都有自己的特点和适用范围。但总的来说,还是工具
2)商业角度:工作或应用中,首先都是从商业角度出发的,尤其是哪些是高频使用的,或者离“钱”更近的地方,也就是决策价值更大的地方。
当然从工具使用到商业价值的转换,还需要你有自己的思维和建模能力
商业相关书籍推荐:
《洛克菲勒留给儿子的38封信》
《商业冒险:华尔街的12个经典故事》
《从0到1:开启商业与未来的秘密》
《商业的本质》
数据分析相关书籍:
《数据挖掘:概念与技术》
《Pentaho Kettle解决方案》
《精益数据分析》
《Small Data》
《利用Python进行数据分析》
2018-12-18
upup
2
思维和业务能画等号吗?我认为不懂业务只会工具和算法的不叫数据分析师,因为他没办法解释业务。有了数据思维能通用于任何行业吗?
2018-12-18
作者回复
同意你说的,我在后面也会讲到,想要用数据挖掘,第一步是对商业的理解,只有确定好了商业目标,数据挖掘才有目标。
数据思维是一种思考方式,世界本身有很多维度,我们从哪个维度看待它,就会从哪个维度收获它
2018-12-18
勿忘初心
2
数据挖掘:对数据累计过程
数据分析:通过数据关联,进一步解决现实问题
数据思维:暂时没想到
2018-12-17
作者回复
感谢你的分享,数据挖掘其实是算法的过程,也就是创造“分类器”,这个分类器就是机器的大脑
数据分析,算是个比较大的概念,包括了 数据采集,数据预处理,数据可视化,和数据挖掘的过程。
数据思维,这个应该是底层的思维了。更多时候,是我们看待问题的角度。
你用什么样的方式看待它,就会有什么样的结果。这个说起来有些“哲学”高度,换个角度来说,也可以说是我们对“数据”的好奇心。
2018-12-18
鱼鱼鱼培填
1
学习笔记:
数据分析的运用:
了解产品用户画像,分析留存率/流失率等指标,更好地改善产品
预测股票、比特币的走势
信用卡反欺诈、屏蔽垃圾邮件等生活烦事
MAS学习法
多角度认识
掌握基础概念
使用好工具
多练习多实践
不懂就要向他人学习
将学到的知识用自我认知分享出来
期待跟着老师学习,之后可以找到相关工作
2018-12-19
极客李
1
您好,看到这个课程很兴奋,感觉实用性会很强,能理论结合实际。我之前自学过numpy和pandas库,但是一直没明白怎么把它们应用到具体的场景,能带来什么实际的效益。
2018-12-18
作者回复
numpy和pandas是python的第三方库,你可以理解是对python的扩展,他定义了适合数组和矩阵的 数据结构和基础算法。我们就可以很方便的对他们进行操作。
当然进一步的使用数据挖掘算法,你还会用到sklearn库。如果是深度学习的话,还会使用到keras, pytorch 或者 tensorflow框架