5分钟入门机器学习 | 文末视频教程福利大放送


今年科技创投界的爆款是什么?当然是人工智能。


作为支撑人工智能的底层技术之一,机器学习是许多从事人工智能研发和应用的创业公司真正在做的事情。今天小编就给大家带来一篇超详细的机器学习入门指南。


提纲


 (一) 机器学习是什么

(二) 机器学习能干什么

(三) 机器学习基本概念

(四) 机器学习理论简介

(五) 机器学习的局限性

(六) 思考题
(七) 面试求职


什么是机器学习?


探究和开发一系列算法来如何使计算机不需要通过外部明显的指示,而可以自己通过数据来学习,建模,并且利用建好的模型和新的输入来进行预测的学科。 


机器学习能干什么呢?


人脸识别 


手写数字识别 


垃圾邮件过滤 


以上技术都使用到了机器学习



我们学习机器学习能干什么呢?


互联网公司都需要大量的机器学习工程师,很多的创业公司都已经开始搞机器学习和大数据了,这是一个非常有想象空间的领域。 当然大疆创新、face++、第四范式、地平线这些非互联网公司也做的很不错。

根据处理的数据类型不同 有文本处理(NLP,这个需 求最大)、语音识别(如百度语音搜索、讯飞语音) 视频识别(如无人车)以及其他的数据挖掘,如金融征信、量化交易、智能硬件中的数据挖掘等。以熟知的互联网公司举例,今日头条做个性化推荐、滴滴打车做智能调度算法。


机器学习与人工智能有什么关联?


人工智能是一种应用领域,机器学习是实现人工智能的 一种手段,但是不限于此。 PR(模式识别)DM(数据挖掘)属于 AI 的具体应用。


重头戏 | 理论框架



监督学习( Supervised Learning)

  • 从标记的训练数据来推断一个功能的机器学习任务 

  • 根据输出变量的类型,监督学习分为以下两类学习问

  • 回归:定量输出称为回归,或者说是连续变量预测

  • 分类:定性输出称为分类,或者说是离散变量预测 


在我们的面试过程当中,面试官常常喜欢问 回归和分类是什么区别?



无监督学习Unsupervised Learning


  • 用于处理未被标记的样本集,模型能够自主学习到知识。
    常用:GMM、聚类、降维、深度学习的逐层训练等 

  • K-means是无监督的聚类方法,KNN是有监督的分类方法,所以不要弄混喔! 


强化学习(Reinforcement Learning

强化学习就是智能系统从环境到行为映射的学习,以 使奖励信号(强化信号)函数值最大。

  • 基本组件:

  • 环境 

  • agent(交互对象)

  • 动作

  • 反馈(回报,奖赏)

  • 应用:机器人等 


经典算法


机器学习不是万能的 | 局限性


在手机上的一些照相app中,有这样一种功能,通过面 部拍照可以识别出人的年龄,但是经过亲测发现,在面 部光线充沛和光线偏暗两种情况下,程序判断出的人的 年龄差别很多,差十年都是很正常的,这是为什么呢


机器学习本质上还是一种统计方法,它只讲求统计意义未必考虑的是事情的本质 

对于机器学习模型来说,准确率和召回率都不可能是 100%,极端case难以避免。

 

还记得大明湖畔GAN?通过GAN合成一些噪声一 样毫无意义的图片,就能轻易骗过你高大上的机器学习模型


对于金融交易、自动驾驶等事关大笔资金安全、人身安 全的场景中,不要盲目迷信AI。不要把你的安全全部交给模型。


正确的做法是:规则(经验)+模型融合。 


学会批判热点 

为了否定和质疑别人的机器学习模型,有哪些思考的角度


Facebook聊天机器人开始自创语言了?程序的bug! ”在通过照片识别同性恋这样的任务中,斯坦福的人通过 平均人脸的模型发现同性恋男性更少留胡子那么 会不会出现这样的情况 一个人模型判定为非同性恋的家伙剃掉胡子以后再用模型判断,就变成了同性恋,从机器学习的角度,完全会有这样的情况发生。


机器学习工程师面试题有哪些?

  • 大数据基础: 大小表的map-reduce

  • NLP基本知识: edit distance
    数据结构与coding

  • 手写快排、二分查找(C++/python)leetcode 


  • 深度学习理论

       lstm原理 CNN做文本分类的网络结构 

  • 传统机器学习理论

       boosting的原理, 手推SVM

       手写造轮子:kmeans hadoop实现 


 

怎样成为机器学习工程师?

  • 辅助技能(linux python 数学

  • 机器学习概念和实战 

  • 深度学习理论和实战 tensorflow 等工具 

  • 具体业余领域的训练(NLP、视 觉、SLAM

  • 最好还懂基础编程语言(C++/java) 

  • 最好有大数据的基础(hadoop spark) 


  我该学什么 ?

  • 基本的语言能力: linux Python C++或者JAVA

  • 算法和数据结构功底

  • 机器学习理论和一定的实战经验

  • hadoop  spark(加分

  • 实习或者竞赛经验(加分


  怎么学?

  • step1: 拜师 剃发明志 

  • step2: 扎马步 

  • step3: 学武功 


  •  step4: 结合具体应用场景

    (如NLP 计算机视觉) 进行实践做项目参加竞赛或者实习 

  • step5:找工作 面试

  • step6:修炼圆满 走进FLAG/BAT 


文末福利

Ape君特此献上

斯坦福大学机器学习入门视频课程

无套路,无需分享

只需要关注并回复即可直接获取课程链接




©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容