当前位置：首页 > 优惠 >大语言模型>文章详情

新型大语言模型推理框架DoT：通过构建一个有向无环图（DAG）来模拟迭代推理过程

推荐人：暴走AI| 商城: AI | 10个月前 (09-17)| 分类：大语言模型 | 热度：164 ℃

已关闭评论

清华大学创新研究院、上海人工智能实验室和上海启智研究院的研究人员推出DoT框架，它是一种新型大语言模型推理框架。DoT通过构建一个有向无环图（DAG）来模拟迭代推理过程，这种结构比传统的线性或树形结构更能捕捉人类推理的复杂性。

GitHub：https://github.com/diagram-of-thought/diagram-of-thought

例如，你是一个大型语言模型，需要回答一个复杂的问题，比如“哪个更大，9.11还是9.8？”使用DoT，你可以首先提出一个命题（比如“9.11大于9.8”），然后作为批评者，你可能会发现自己犯了一个错误，因为9.11实际上小于9.8。然后，你作为提议者改进你的命题，最后作为总结者，你得出结论“9.8更大”，并提供这个答案。整个过程就像你在脑海中反复思考和修正你的推理一样。

主要功能： DoT的主要功能是提高大型语言模型在复杂推理任务中的表现。它通过组织命题、批评、改进和验证，形成一个连贯的有向无环图结构，使模型能够在保持逻辑一致性的同时，探索复杂的推理路径。

主要特点：

有向无环图（DAG）结构： DoT将推理过程建模为一个DAG，每个节点代表一个被提出、批评、改进或验证的命题。
角色特定令牌： 通过使用特定角色的令牌（如<proposer>、<critic>、<summarizer>），DoT能够在提出想法和批判性评估之间无缝转换，提供比二元信号更丰富的反馈。
自回归下一个令牌预测： 利用自回归模型预测下一个令牌，使得模型能够迭代地改进其推理。
拓扑理论的形式化： 通过拓扑理论为DoT提供数学基础，确保推理过程的逻辑一致性和有效性。

工作原理： DoT的工作原理包括以下几个步骤：