如何规划出完美的机器学习入门路径?| AI知识科普

书山有路勤为径,在学习进修的道路上,正确的路径比埋头勤奋要重要的多。

最近两年AI在线学习和教育呈喷涌式发展,机器学习的培训课程也是层出不穷,专业的教育和课程固然重要,但在这个过程中最关键的是如何规划出合理的入门路径,保证自己学习的课程、实操的项目都是符合自身的。

今天晚上我们就来探讨下初学者如何规划出近乎完美的机器学习路径。

01

机器学习基本概念

要规划出合理的学习路径,必须先对机器学习有个基本的了解。

机器学习是一种计算机程序,可以从现有的经验中学习如何完成·某项任务,并随着经验的增加,性能也会随着提升。

这里的经验也就是所谓的数据,对于机器学习来说,数据库的大小对结果起决定性作用。

根据训练方法的不同,机器学习可分为:监督学习,无监督学习,半监督学习,强化学习。

在这里我们讲2种机器学习的常用方法:监督学习,无监督学习。

监督学习是从标记的训练数据来推断一个功能的机器学习任务,可分为“回归”和“分类”问题。

定量输出称为回归,定性输出称为分类。比如根据房屋的地理位置、面积大小、以及房屋周边的配套设施等因素,来预测给定房屋的价格,这就是典型的回归问题。

但是,如果我们预测一个给定面积的房屋的价格是否比一个特定的价格高或者低的时候,这就变成了一个分类问题, 因为此时的输出是“高”或者“低”两个离散的值。

无监督学习也被称为非监督学习,无监督学习和监督学习最大的不同在于,事先没有任何训练样本,而需要直接对数据进行建模。

无监督学习只能默默地读取数据,自己寻找数据的模型和规律,比如聚类(把相似数据归为一组)和异常检测(寻找出一组数据的不同一个),在无监督学习中给定的数据没有任何标签或者说只有同一种标签。

比如小时候我们还不认识钱币,看到一堆纸币和硬币,会很自然的把纸币和硬币分开,这就是最简单的聚类原理。

02

机器学习中的经典算法

机器学习中所涉及到的算法有很多,比较典型的算法有决策树、回归、神经网络等。

决策树

决策树是机器学习中很经典的一种算法。它既是分类算法,也是回归算法,还可以用在随机森林中。

咱们学计算机的同学经常敲if 、else if、else其实就已经在用到决策树的思想了。

决策树是一种简单常用的分类器,通过训练好的决策树可以实现对未知的数据进行高效分类。

决策树的基本流程

举个例子,普通人去银行贷款的时候,银行会根据相应条件,来判断贷款人是否具有还贷能力。

贷款用户主要具备三个属性:房产、婚姻、平均月收入。

拥有房产或结过婚或月收入大于4000的贷款用户具备偿还能力。

判断偿还能力过程如图所示

例如:用户甲没有房产,没有结婚,月收入5K,通过上图的判断条件可以判断出用户甲具备偿还贷款能力。

这整个判断还贷能力的过程,就用到了决策树的思想。

回归

在统计学中,线性回归通过过拟合因变量和自变量之间的最佳线性关系来预测目标变量。

最佳拟合通过尽量缩小预测的线性表达式和实际观察结果间的距离总和来实现。没有其他位置比该形状生成的错误更少,从这个角度来看,该形状的“拟合”是最佳。

线性回归2个主要类型是简单线性回归和多元线性回顾

简单线性回归使用一个自变量通过过拟合最佳线性关系来预测因变量的变化情况,多元线性回归就是使用多个自变量来预测因变量的变化情况。

支持向量机

支持向量机是一种分类方法,力求在样本中画出一道线,让线距离两边样本的距离最大

它在文本分类、图像分类有较多应用。如果桌上有红豆和绿豆,我们可以把SVM想象成一个忍者,他画了一条线,把红豆和绿豆分开。

但有时候豆子掺和在一起,怎么办呢?我们可以针对红豆和绿豆的不同特性,把这些豆子通过核函数进行计算,把他们映射到高维空间去,这样豆子自然就分开了。

神经网络

神经网络也是一种分类器,它是由很多个虚拟的神经元组成的一个网络,我们可以把一个神经元看成一个分类器,那很多个神经元组成的网络就能对样本进行很多次分类。

朴素贝叶斯分类器

朴素贝叶斯分类器是一种统计学的分类方法,其基于朴素贝叶斯定理,给定一个样本观测点,预测其属于某一类的概率。

比如说,我们要识别一封邮件是不是垃圾邮件。我们随机挑选出100封垃圾邮件,分析它的特征,我们发现“便宜”这个词出现的频率很高,100封邮件里有40封出现了这个词。

那我们就以结果为依据,得出结论:如果出现了“便宜”,那么该邮件有40%的概率是垃圾邮件。

这就是基本的朴素贝叶斯分类器算法。

03

机器学习入门路径规划

学习python编程,了解算法与数据结构

Python已成为AI和大数据时代的第一开发语言,无论同学们现在处于哪个阶段,Python编程是一定要学习的首要技能,Python能够被很多第三方库支持,而且Python本身语法很简单,初学者也很容易上手。

掌握足够多的数理知识

数学对机器学习的重要性不言而喻,尤其是微积分、概率统计、矩阵、凸优化等基础数学知识,除了掌握好相应的数学知识之外,还需要了解数学在机器学习中的工业应用,理论知识和实践缺一不可。

逐步学习并熟练应用机器学习算法

涉及到具体的机器学习算法,比如我们前文提到的决策树、回归、朴素贝叶斯等,这类算法不仅仅需要掌握它们的理论知识,更需要在实际应用中了解它们的模型构建和模型优化。

机器学习实战应用

一切的学习都是以实际应用为导向的。

大家经历了前三个步骤的学习积累,基本上该掌握的理论和算法都已经掌握了,这一阶段该做的就是去实际做一些项目,将之前所学的知识融会贯通。

作者:AI研究所

链接:https://www.jianshu.com/p/1aa32aa2f9e5

來源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容