随着AI 和GPT的发展,很多人从公有的大模型库都在思考如何构建自有的私有模型库。但是我们发现很多人做的事情,包括推出的小应用都在做10多年类似智能客服机器人的事情。或者是在做原来企业知识管理,全文检索相关的事情。但是这些事情并没有真正构建我们所期望的第二大脑。
先界定一下我所理解的第二大脑。第二大脑是个人身体外一个由AI实现的智能附属体。这个附属体能够自我学习和进化。所以第二大脑必须满足两个关键特点,第一个特点是它是个人数字孪生大脑,和自己大脑自己随时保持双向信息沟通和交互。第二个点,第二大脑不是简单的知识存储库或者记忆库。第二大脑更多是能够不断沉淀和学习已经形成的知识文档。同时更加重要的是不断学习我们的行为模式,思考方式,分析解决问题的方式。通过这些学习,才能够持续进化,真正变成能够满足个体需要的大脑能力。所以基于这些带你,我们可以看到,我们当前在做第二大脑的时候,更多是在做自己个人专有私有模型的知识库。能够做简单只是检索,检索出来后做一个简单知识整合,但是这个并没有什么大的用处。
第二大脑如何构建应该会到思考我们个人如何思考的。其实个人思考的构成也相当简单,就是有一些列外部问题,外部需求输入。我们拿到这些输入后会充分调动已有的记忆库,经验模式库,包括原来已经积累下来的知识、文档。如果这些东西都还不足够,我们还会去搜索互联网已有的公有数据库,找到需要的知识。当这些东西都准备齐全以后,需要调动我们的大脑去做相应的推理、判断、知识加工处理,最后形成期望的答案。
所以在这个里面,我们可以看到这个只是经验库包括几个方面内容。第一个是我们沉淀下来的显性化文档,第二个是我们存在个人大脑中没有显性输出的隐性经验。就每个人而言隐性经验站到90%以上。第三个是海量互联网知识库,能够做标准问题到标准解决答案的输出。因为这些已经是标准答案。所以我们去做这件事情的时候,互联网海量标准的问题知识库已经由GPT解决了。个人已经形成在我们电脑中各种文档和资料,GPT搭建私有模型库也已经解决。但是还有两个关键问题没有解决,第一个问题是我们没有显性化存在于个人脑袋中响应的经验和模式,这个GPT无法解决,第二个是我们面对特定场景问题时候,如何做问题分析和拆解,把问题拆解成标准子问题,怎么做问题整理加工,包括做推理,GPT虽有标准的推理方法论,但是没有结合你自己的专业场景去形成属于你自己的推理模式。
所以我们可以看到,我们只是走一个个人私有模型知识库,其实对于构建完整第二大脑还是不足够的。构建第二大脑更多关键难点在于,第一是我们对于信息采集的完整性。首先要能够完整采集个人涉及到各类型信息。如何采集没有显性化的信息。第二个是从静态结果到动态过程的采集。比如现在给一份技术架构文档,GPT虽然可以学习,但是只是静态知识的学习,因为这个学习脱离了场景和过程。
而动态过程的学习,应该怎样的呢?我们已经有邮件、微信与客户沟通了,他们表达了对技术架构相应的诉求,我们打开分析已有知识库的文档,又在互联网搜索了哪些技术资料,最终匹配以后形成一份完整技术架构方案给客户。客户提出修改和反馈意见,最终又形成一个新的版本给客户。这就是第一个完整的过程。GPT拿到的知识最后静态的文档,但是不知道这个文档产生的过程。随意它很难理解我们的行为模式和过程。它拿到这些离散的文档和知识,却不知道这些文档版本前后存在怎样的依赖关系。
基于这个点我们再去训练第二大脑的时候,有一个关键的点在于它不是一个静态结果的输入,而是能够跟踪学习模式和行为模式。整个动态过程行为也能够输入给GPT。GTP不断学习动态行为、动态思考模式。这个持续进化、持续训练才是我们真正需要的大脑,才是能够超越个体的大脑。
要做到这一点相当不容易。里面涉及几个关键内容,即在当前互联网以及AI人工智能大浪潮时代,如何解决万物物联下所有外部输入设备之间的的适配。能够实时随时采集所需要的各种信息。其实是个人的做事的方式、思考模式、行为习惯如何形成方法动态输入给GPT。把这两个问题都解决掉,才可能构架你真正满足个人需要的第二大脑。