现在有个概念蛮火,叫做“强化学习”,这个关键词的大红其实和现在的人工智能浪潮有很大的关系,所谓强化学习,就是带着裁判教练的机器学习,这种学习概念,我觉得同样可以用于人类自己的学习模式。
首先解释下“机器学习”,在我的概念里,机器学习就是建立一套数学模型,以期望与现实研究对象相契合:例如 你研究的是宏观经济,那么你就需要建立一个能模拟宏观经济的数学模型,里面应该有多少变量,理论上应该由你这个研究者决定,但是建模的目的是去契合现实中的研究对象,所以你需要一遍遍的检查这个模型,看看是否有遗漏或者错误的地方,使得这个模型无法重现宏观经济的真实走向。我只能从一个文科生的角度来理解“建模”这个概念。据我所知,几十年前,大专院校的经济学系,起码在博士学位这个层级,已经在尝试用建立数学模型来构造真实世界的经济。至于有没有成功,目前来看,应该没有。因为社会经济都是一个超级复杂的混沌系统,忽略一个重要变量,就会让整个系统崩溃,这个可比研究围棋难多了,而且如果真的成功了,中国的首富肯定不是马云而是那个经济学家了。
那么,什么又叫做“强化学习”呢?开头说了是带着裁判、教练的“机器学习”。也就是在学习的过程中,不断的干预错误的学习方向,比如说特斯拉的无人驾驶汽车,在简单路况下,可以开的很溜,但是到了复杂路况上,就不一定能玩的转了,比如说到了乡村道路上,并没有明显的路标,路边还经常有行人或者牲畜通过,这个时候,就需要人为的干预反馈,使机器明白,有些障碍应该如何避开。这种模式其实也可以应用到人类学习的过程中,有个著名的篮球教练,曾经多次带领球队拿到总冠军,但是记者发现,他的指令都非常的简短,及时。也就是几个单词,但是都非常及时,在问题出来的一刹那,他的纠正指令就已经给出,所以球员也能马上得到行为修正。
同理,强化学习在教育儿童的方面,也能得到极大的应用。