机器学习是什么
老师列举了个实例漫画,一个机器人被切开了后里面都是if(else),这种机器人不具备自我学习的能力
机器学习 是根据我们的大量数据寻找到一个function函数,以获得对新数据的预测(回归)或识别(分 类)的过程
回归
函数输出是个 数值(连续或区间连续)
分类
函数输出是0,1,2,3……(包括多分类和二分类)
二分类
函数输出是0,1即yes,no,如判断是否为垃圾邮件,是不是一只猫
多分类
函数输出是多个类0,1,2,3等等,如判断文章属于什么类型(政治,社会,经济,体育等)
分类学习有无监督
监督
数据有对应的标签(已分类好)
可分为有监督,无监督,半监督
半监督,测试数据部分没有标签,可能只有小部分有标签,但是没有标签的数据是有用的
无监督,测试数据没有标签(无法通过标签直接判别验证),如让机器自己看大量文章,进行分类等等
迁移学习 transfer learning
如要训练猫狗的分类,有大量无关的图片数据(可能部分有标签)
结构学习structure learning
输入数据,提取多个信息(目前有很多技术尚未被探明)
强化学习reinforcement learning
常常是因为没有办法做监督学习(缺少数据)
与监督学习相比,监督学习会给出正确答案,而强化学习会给出一个评价
如聊天机器人跟人聊天,人给出对话评价,机器学会总结
如alpha go下棋,给出下棋的评价(其实alpha go是监督学习和强化学习的结合)