什么是机器学习?
机器学习是一帮计算机科学家,想让计算机器像人一样思考,所研发出的计算机理论。
由一大批互相连接的 信息传递 和 存储元素 所组成的系统。
所以,有了这样的想法,加上 他们独天得厚的数学方向知识,机器学习的前身就孕育而生了。
机器学习的萌芽,诞生于19世纪60年代,到20年前,开始逐渐兴起的一门新兴学科。他是一门跨学科的交融。
这里面包含了概率论、统计学等等学科。
随着计算机硬件的提升,计算机运算速度的不断的提高,它将逐渐进入到我们的日常生活当中。
Google Now、Google Photo也是基于机器学习的产物。
机器学习不仅仅只有一种方法,实现它的方式多种多样,这种方法在程序语言中,我们叫它算法
目前,所有机器学习的算法,大概可以被分为4、5类。
一:监督式学习(Supervised Learning)
如果在学习中,我们不断的向计算机提供数据,和这些数据所对应的值。
比如:给计算机看猫和狗的图片,告诉计算机,哪些是猫,哪些是狗。然后再 让它通过学习,去分辨猫和狗。通过这样指引的方式,让计算机学习我们人类,是如何把这些图片数据对应上图片所代表的物体。也就是让计算机,学习这些标签可以代表哪些图片;这样的方式,就是监督式学习。预测房屋的价格、股票的涨停,就可以运用此类的方式实现。神经网络也是监督学习的一种方式。
二:非监督式学习(Un-Supervised Learning)
如果在计算机学习的过程中,我们只给它提供猫和狗的图片,但是并没有人为的告诉它,哪些是猫,哪些是狗。取而代之的是,让它自己去判断和分类,让它自己总结出,这两种类型的图片的不同之处。这就是一种非监督式学习。在这一种学习中,我们不用提供数据所对应的标签信息。计算机通过观察各种数据之间的特性,会发现这种特性背后的规律。这些规律,也就是非监督式学习所学到的东西。
三:半监督式学习 (SEMi-Supervised Learning)
这一种方法,综合了监督学习和非监督学习的特征。
它主要考虑,用少量有标签的样本,和大量没有标签的样本进行训练和分类。
四:强化学习 (Reinforcement Learning )
也就是把计算机丢到一个对于他完全陌生的环境里,或者让它完成一个从未接触过的任务。它自己会去尝试各种手段,最后让自己成功适应这一个陌生的环境;或者学会完成这一件任务的方法途径。
比如:我想训练机器人去投篮,我只需要给它一个球。并告诉他,你投进了,我给你记一分,让它自己去尝试各种各种的投篮方式。
在开始阶段,它的命中率会非常的低。不过他会像人类一样,自己总结和学习投篮失败和成功的经验。最后达到很高的命中率。
五:遗传学习算法
这种方法是模拟我们熟知的进化论,淘汰弱者,适者生存,通过这种淘汰机制,去选择最优的设计方法和模型。比如让计算机玩跳一跳,最开始跳不过几部,就失败牺牲了。不过计算机会基于第一次的玩的经验,生成第二次的玩的方式。然后再保存这种跳的步骤里,最优的跳的力度和步骤。淘汰失败率较高的方法,然后再次基于强者繁衍和变异生成更强的 跳一跳小人,这就是遗传算法的基本思想。
上面就是当今比较重要的几个学习方法。