在即将结束21年寒窗苦读,告别学生生涯之际,总想写点什么有深度一些的感想,于是乎便有了这篇将人工智能领域的学术思维和近几年对人生社会的思考相结合的产物。由于笔者人生阅历尚浅,文笔匮乏,若不能引起诸位的思考共鸣,也可当作一篇标新立异的奇葩小作文,看着便哈哈一笑而过。
很多人都说决定人生下限的是智商,决定人生上限的是情商。如果就这么将复杂的人生用如此精简的法则去概括了,我还是想说图样图森破。在基于近几年个人经历而建立的理论体系中,我认为智商确实决定的是人生的下界,但是情商决定不了人的上界,假设人的发展遵循某种函数曲线,那么情商可能能够影响的只是从下界到上界的这条曲线的斜率。那么到底什么才能决定人的上界?这绝对不可能是一个很简单的法则就能够概括的,基于个人的经验性思考,我认为决定人生上界的是基于情报力、规划力、执行力和复盘力四者精密耦合的底层操作系统或者说思考模式。如果拥有一个强大的底层操作系统,相信即使遇到再大的困境,我们也能够安然跨越,只是波折的多少而已。接下来咱们就来对这四大能力进行一个粗浅的探讨,也许大家会发现人类的社会学习和智能体的机器学习简直具有天然的统一性美感,毕竟人类的社会学习启发了机器学习新范式的发展,同时我们也可以从机器学习中获得可以映射到人类社会学习中的经验,互相迭代进步,这也有可能是未来一种人机融合的发展模式。
情报力:情报力是产生智能和行为决策的基础。就从情报的英文翻译intelligence与智能一词的翻译相同上就可见一斑。当今我们处于信息量爆炸的互联网时代,从纷繁复杂的信息中提取分析我们最想要的信息,或者从碎片化的信息中逐步去复原事物的真相,这就是情报力。类比机器学习,特征的好坏直接影响下游任务的效果,因此在传统的机器学习中的特征工程的重要性不再赘述,在深度学习中如何设计更好的编码器以从大数据中自动学习重要的表征也是一直被研究的重要问题。无论是特征工程还是深度表征学习,其核心都是在于从复杂的数据中提取到最有用的特征,也就类似我们人类在社会学习的过程中从爆炸的信息流中获取我们最需要的情报。与机器学习模型一样,我们只有获取了足够有用的情报(特征)才能为后续的行为决策做一个良好的铺垫。
规划力:规划是在获取到有效的情报特征的基础上,为了完成某种下游任务目标而进行的策略优化过程。规划能力体现在是否能够合理地设定阶段性目标和分配激励。类比基础的深度强化学习方法,深度编码器用于从复杂的环境数据提取情报特征,基于贝尔曼方程的Q学习机制来向着奖励最大化的方向学习。影响策略学习的一个非常重要的因素便是奖励值的设定,若是奖励设定不合理或者过于稀疏,则难以学习出一套有效的策略。这点其实很容易映射到人类的社会学习中:如果我们设定一些跳一跳能够得着的目标并在完成目标时及时奖励自己,往往能够使得努力更加有后劲;反之如果目标设定不切实际,激励过于稀疏,这样往往会导致我们因为不能完成预期目标而对努力的积极性造成打击。想起伟人的““农村包围城市”理论体系,可以说这是规划力的极致体现:任何大事业的成功都是建立在设定了合理的小目标和激励的基础上。
执行力:执行建立在完整规划的基础上,它的重要性不言而喻。自律、毅力便是执行力的集中体现。再好的规划若不坚定地付诸执行都是空中楼阁。执行可以类比深度学习中的前向传播过程,即按照既定的学习权重执行整个网络并输出一个结果,不管它与我们的预期差距还有多少,总比没有付诸执行的空头规划更强。只有敢于执行才可能看到结果与预期的差距,再进行迭代式的调整。
复盘力:看到了结果与预期目标的差距,正视它并对自己过往的策略进行反思总结,迭代提高,这体现的就是复盘力。复盘对应深度学习中的误差反向传播阶段,以微分的方式将执行结果相较于预期的误差反向传回神经网络,对其中的可学习权重进行调整,以期望在下一轮的执行中获取到离预期更相近一些的结果。同时,设定合理的学习率也是很重要的,过小的学习率意味着太过谨小慎微的学习策略调整,容易陷入局部最优解,过大的学习率又意味着太过冒进的调整,容易造成学习策略的崩盘。因此,类似深度学习需要设置一个合理的学习率一样,我们在复盘的过程中也一定要根据自己的实际情况做出清醒但不冒进的策略调整。
将社会看作一个复杂系统,我们每个个体都是这个复杂系统中的一个自主学习的智能体,通过情报力从复杂环境中获取有用的知识情报,通过规划力根据掌握的情报规划出最有利于自己的行动策略,通过执行力坚定地贯彻自己的每一步决策,最后通过复盘力反思自我的和迭代提高。以上四种能力互相耦合构建成了我们的底层操作系统,唯有不断强化升级我们的底层操作系统才能够更好地抵抗复杂系统中的各种随机扰动,在现实的非完全信息博弈中达到自己期望的全局最优解。最后祝愿这个夏天的毕业生们都能得偿所愿,锤炼出强大的底层操作系统,应对未来社会的风浪!