【说明】
来自慕课网机器学习基础课程的学习笔记,扫盲基本概念。
一、什么是机器学习
定义:利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。
分类:
离线机器学习:如每晚定时任务建模分析数据进行学习。
在线机器学习:实时的进行建模分析数据学习,来一条分析一条,学习一条。如购物节等。
二、典型案例
关联规则算法
场景:购物篮分析,根据购物篮分析哪些商品是被同时购买的。
聚类算法
场景:用户细分精准营销。
朴素贝叶斯算法
场景:垃圾邮件识别。
决策树算法
场景:信用卡欺骗,银行风险识别。
CTR 预估算法(背后算法是线性逻辑回归算法)
场景:百度的搜索结果,会在竞价排名的基础上,优先显示用户最可能点击的一条结果,这个结果是结合用户之前的行为习惯排序展示的。
协同过滤算法
场景:购物组合推荐。
三、机器学习算法分类
算法分类1
有监督学习、无监督学习、半监督学习
有监督学习
分类算法、回归算法,明确给出学习算法中的Y值
无监督学习
聚类:没有给出算法中的Y值,需要把用户分成几类自己提前都不知道,根据结果去看Y应该是什么样子,典型的场景比如电信的用户分类。
半监督学习(强化学习)
开始有Y值,但是Y值的数据样本不好,随着数据越来越好,样本越来越好,结果越来越好。
算法分类2
分类与回归、聚类、标注
算法分类3(重要)
生成模型、判别模型
生成模型:告诉你某个数据30%可能是模型中的A类,30%可能是模型中的B类,50%是模型中的C类,是一种推断。
判别模型:告诉你某个数据是模型中的某一类,是一种结果。