《控制论与科学方法论》第一章
控制论旨在通过一些控制手段使得事物朝着目标的方向发展。控制的手段有很多,作者简单介绍了最常见的几种。
随机控制
当人们对于某一个事物的了解处于最开始的懵懂无知状态时,随机控制往往是最先用到的手段。一个典型的例子就是神农尝百草。原始人类对于各种植物的治疗功效一无所知,所以只能通过随机尝试的手段加以检验。我还想到一个案例。电影里经常见到的一个场景是炸弹即将爆照,主人公还没有找到拆除的办法,然后就随机地剪断某一个导线。随机控制的坏处是不可控,当可能性空间非常大时,工作量就会变得非常巨大,尤其是如果需要人工执行的话。不过,现代社会随着高速计算机的出现,随机控制又展现出了巨大的应用价值。比如,现在非常火的机器学习算法,就是通过极大量的随机抽样数据,训练机器识别目标信息。数据量越大,随机性越高,训练效果也随之越好。还有20世纪末首次完成的人类全基因组测序时所使用的鸟枪法,也属此类。
有记忆的控制
这是指当选择一种情况之后,就不再重复选择相同的情况。我想到了中学数学课上做的关于排列组合的题目:从一堆球中不放回地抽出2个黑球和2个白球的概率。人类的记忆也属于此类。还是拿做数学题举例,在解几何体时,经常需要画辅助线进行求解。当尝试过一种方法无效时,我们就会换一种新的方法,而不会又绕回之前的不正确的解法。这让我联想到了孔子讲的“不二过”,颜回能够做到绝不重复之前犯过的错误,对于一个人成长而言,只怕没有比这更快更有效的途径了吧?
共轭控制
作者用曹冲称象的故事来作解释。因为没有办法直接称量大象的体重,所以曹冲想到通过将大象的体重转换成具有相同重量的石块,然后通过称量石块的重量进而推知大象的体重。在这个过程当中,首先需要将大象的重量转换成同等重量的石块,该过程记为L,然后称量石块重量,该步骤记为A,最后将石块的重量转换成大象的体重,该步骤极为L-1。整个步骤可以记为L-1AL。通常将L-1AL称作与A共轭的控制方法。此法的好处是将原来不可控的对象变成可控的A过程。这让我想到了跨人际的调控。A想让C做某事,但A和C没有直接关系,故而找到和C具有直接联系的B,通过B实现间接控制C。公司里跨部门的人员调用属于此类。
负反馈控制
一个典型的例子是空中的雄鹰追捕快速奔跑的兔子。雄鹰向下俯冲之时,眼睛紧紧地盯着兔子的跑动,随时调整自己飞行的方向,角度,姿势,逐步缩减和目标之间的差距,直至最终与目标重复。“目标差”的减少是负反馈控制的核心。负反馈控制包含3个基本组分:感受器,控制系统,效应器。感受器实时采集关于目标的所有信息,传入控制系统,控制系统及时调整效应器,以实现逐步减小目标差。大脑就是一个高效的负反馈控制系统。眼睛看着碗里的菜,该视觉信息输入大脑,大脑再发出指令控制手中的筷子以精准的夹住想吃的菜。许多生态系统的动态平衡也包含负反馈控制。应用于个人,应该说,一切高效的学习过程都离不开负反馈控制(在学习的早期,从错误当中学习扮演着更为重要的角色,即学习的目标是减少错误)。反馈越及时,越准确,学习的方向越清晰,越有针对性,犯错就会越少,进步的速度也就越快。这是学习中每一章节练习题的价值所在,也是学习游泳时有教练在旁边提供实时反馈的价值所在。很多时候,学习进度停滞不前,往往都是因为缺乏及时准确的反馈信息。善于学习之人,应当在大脑中努力搜集所有有用的反馈信息,持续做出有针对性地改进。另外,数学建模中减少估计误差的做法也属于负反馈控制。
正反馈控制
良性竞争属于此类。两个朋友在学习上你争我赶,互相砥砺;两个相互竞争的企业,相互较劲,有可能刺激整个行业不断创新,不断进步。比如可口可乐和百事可乐。机器学习中的加强学习(reinforcement learning)算法,心理学中学习理论的正向增强子(positive reinforcer)效用,日常生活中通过鼓励来促进他人的做法,都属于此类。在《掌控习惯》或《福格行为模型》这两本书里介绍的通过及时提供正反馈以养成习惯的做法也属于正反馈控制。此法既可以用于调控自己的行为,还可以用于(在商业中)操纵他人行为。