蚂蚁集团推出新型检索增强型文本生成框架METRAG(Multi-layered Thoughts enhanced Retrieval-Augmented Generation),这个框架旨在解决现有大语言模型(LLMs)在知识密集型任务中遇到的一些问题,比如知识更新的不及时、成本问题以及生成幻觉(即生成与事实不符的内容)。
例如,用户询问“乔治·R·R·马丁的著名作品是什么?”一个基于相似度的检索系统可能会根据文档与查询的语义相关性来排名文档,但可能无法区分哪些文档提供了最有用的信息。METRAG框架不仅考虑相似度,还通过实用性模型来评估文档对回答问题的帮助程度,并通过摘要生成器提炼出最相关的信息,最终生成一个准确且简洁的答案。
主要功能:
METRAG框架的核心功能是提升检索增强型文本生成的性能。它不仅仅依赖于文档和查询之间的相似度来检索信息,还引入了多层面的思考,包括实用性思考、紧凑性思考和知识增强型生成。
主要特点:
- 多层面思考: METRAG通过结合实用性和相似性来选择文档,并使用任务自适应的摘要生成器来提炼关键信息。
- 实用性模型: 引入一个小规模的实用模型,该模型接受大型语言模型的监督,以提高检索的相关性。
- 任务自适应摘要: 将大型语言模型作为摘要生成器,以提炼检索文档中的共同点和特征,生成紧凑的摘要。
- 知识增强型生成: 结合前述阶段得到的多层面思考,利用大型语言模型进行知识增强型的答案生成。
工作原理:
- 相似性与实用性结合: METRAG首先使用一个现成的检索器根据相似度检索文档,然后通过大型语言模型的监督训练一个实用模型,以评估文档对回答问题的实用性。
- 任务自适应摘要: 利用大型语言模型的能力,对检索到的文档集合进行摘要,提取与查询最相关的信息,减少对大型语言模型的计算负担。
- 知识增强型生成: 在前两个阶段的基础上,使用大型语言模型结合检索到的知识和摘要来生成答案。
具体应用场景:
- 开放域问答: 在开放域问答任务中,METRAG可以通过检索和摘要来提供准确的答案,尤其是在需要广泛知识背景的情况下。
- 知识更新: 对于需要最新信息的任务,METRAG可以通过检索最新的文档来弥补大型语言模型知识更新的延迟。
- 长尾查询处理: 对于长尾查询,即那些不常见或特定的查询,METRAG可以通过检索增强来提供更好的答案,尤其是在大型语言模型自身知识库中没有足够信息时。
0条评论