张伊凡、袁洋在AI的推理方法中,将线性链条的推理CoT(Chain of Thought)拓展为路径为DAG(单一模型内构建有向无环图)的推理DoT(思维图 Diagram of Thought),使得机器的推理过程更接近人类的模式。(原文请看本文后面的连接)
一、人类推理模式
人类的认知过程包括概念、判断和推理的思维要素。有效推理,需要提出的命题是有效的,推理的过程,是符合逻辑规则的。实际上,面对一个问题的解决,有不同的步骤设置,在这不同的步骤中,就对应着相应的每一个步骤的命题和推理逻辑规则,在每一个步骤之中都会观察是否有效,如果是正确的,就向后面推,相当于检测代码bug的时候都是一段一段往后推进的。对于可能存在的多条成功解决路径,最后归纳总结成为一个解决问题的序列方法。
上述面对问题的解决框架,人类常常是分而治之,分为多个方法,一个一个方法来试,是个一个动态决策过程。问题描述➯先往前推进一步➯看看效果如何,给出反馈意见,正确就可以继续下一步,错误就直接放弃➯调整方法给出新的解决方法➯如果问题解决了,开始下一步➯迭代这个过程,直到所有的问题全部得到解决➯对第二个子问题路径重复之前使用方法的流程➯前面方法中某一个环节的有效结论还可以直接作为前提输入。这个过程说得到的所有的有效解决措施都被学习到。然后归纳优化成为一个推理有效性框架的方法。
二、推理过程模型
1.结构化模型
这样的是一个推理过程,需要结构化为对象和关系。对象包括提议者和他生成的命题/推理步骤、批评者和综合者。这个框架下,为了防止循环论证,整个过程保证单项的流动,在互动中对于判断结果不同而形成的路由关系等。DoT的出现无疑是一个非常合适的方法。DoT,用图论的方法来表达不存在环路和自环的有向图。这个过程避免了循环依赖的出现,
2.几点疑问
不过,对于这个过程,还是有几点疑问:
1).提议者怎样生成命题/推理步骤。这些命题和最早的问题是什么关系?一个问题,提议者会给出多个命题,这些命题是怎样被设定的?命题的细化是怎样实现的?
2).批评者怎样对命题进行评估。通过识别错误、矛盾或逻辑缺陷来评估每个命题。如果提供有效的批评,则将其作为节点添加到 DAG 中。批评者的对错由谁来保障?通过模型本身的不断细化和反馈来验证?但是LLM应该没有学会判断非形式谬误,使用形式逻辑或者数理逻辑来判断吧。
3).总结者将经过验证的命题组合成一个有凝聚力的逻辑链。执行拓扑排序以产生最终的推理输出。专注于合成有助于得出结论的路径
4).总结后的逻辑链在今后的推理中怎样使用。怎样获得更好的逻辑推理方法?汇总的逻辑链通过逐步完善模型来增强推理过程。随着时间的推移,它使模型能够提高其推理能力,类似于人类通过反馈来提高解决问题的能力。
以上的过程已经是模型,结构化了,要便于对这个框架的结构合理性进行判断,需要使用形式化方式来表达,在形式化系统中演算判定系统的特点。
三、形式化描述
1.理论基础
对于推理模型,其在形式上合理,在实际的推理中,这样的形式和规则是否有效,其判断就是一致性和完备性。这个要求让我们自然过渡到数学的系统中。
之前做数据的强制访问控制的BIBA模型,通过多因素来核定两个数据之间的完整性级别高低,判定的条件和关系非常复杂。访问的规则是级别高的可以写入级别低的,但是不读入,反之亦染。对于这一个复杂的情况,我们是通过将主客体和访问关系构造一个偏序集,形式化后对于各种完整性等级主客体的访问方式是否完全符合“上读下写”,是通过数理逻辑通过把合式公式来进行逻辑推理实现的,就保证了设计的系统能完整完成设计的初衷。
高层次抽象的范畴论,研究数学对象之间的结构和关系。基本的结构是“范畴”,由一组“对象”(objects)和这些对象之间的“态射”(morphisms)组成,态射满足:态射之间的可组合性和恒等态射的存在性两个基本条件。关注这些对象之间的关系,而不直接研究对象本身的内部结构(集合论关注的是集合内部元素和集合之间的关系)。
范畴论(Category Theory)的核心概念是“对象”(objects)和“态射”(morphisms),并范畴论通过对象与对象之间的态射,描述数学领域中各种结构的转换和对应。
Topos理论起源于范畴论,由法国数学家亚历山大·格罗腾迪克(Alexander Grothendieck)在研究代数几何问题时提出。既可以看作是一个关于“空间”的抽象理论,也可以看作是一个关于逻辑和计算的框架。一个Topos可以被看作是一类具有某种性质的范畴,类似于“集合范畴”,最重要的贡献之一是将逻辑和几何结合起来,使得Topos可以用于研究数学逻辑中的模型和构造计算机科学中的推理系统。
范畴逻辑是通过范畴论的语言和工具来研究逻辑系统的一种方法。Topos理论中的范畴逻辑特别强调“逻辑结构”如何与范畴论中的态射和对象相关联。通常,我们在集合论中研究逻辑结构,比如命题逻辑、谓词逻辑等,而在范畴逻辑中,这些逻辑结构通过范畴论中的对象和态射来表达。
Topos理论中,每个Topos可以看作是一个“内部逻辑系统”,类似于经典集合论中的模型。范畴逻辑中的命题、量词、推理规则等都可以通过范畴对象之间的态射来描述。
PreNet范畴是特定类型的范畴,通常用于表示并行计算中的网络模型。这种范畴的对象表示网络的不同状态,而态射则表示状态之间的转换。这种模型在Petri网和分布式系统等领域中得到了应用。PreNet范畴的结构通常是有向图的抽象化,用来描述事件、进程或系统的动态行为。
在PreNet范畴中,重点是定义网络中的并行性和同步性,通过范畴理论工具来捕捉这些系统的行为。它的研究通常与操作语义(operational semantics)和代数语义(algebraic semantics)等领域相联系。
2.对应关系
通过这样的对应,对DoT的思路有了一个理解,用数学理论保证了推理的逻辑一致性。事实上整个表格也可以通过范畴论的方法来进行形式化,极端的抽象在实例化后使用的范围越广。