当前位置：首页 > 优惠 >大语言模型>文章详情

LongCite：旨在提升大语言模型在长文本环境下生成引用的能力

推荐人：暴走AI| 商城: AI | 8个月前 (09-05)| 分类：大语言模型 | 热度：279 ℃

已关闭评论

LongCite：旨在提升大语言模型在长文本环境下生成引用的能力

AI

清华大学和智谱AI的研究人员推出一个名为LongCite的系统，它旨在提升大语言模型（LLMs）在长文本环境下生成引用的能力。LongCite通过让模型能够生成带有精细句子级引用的回答，增强了模型输出的可信度和可验证性。例如，你是一名记者，需要写一篇关于环境政策的文章。你可以使用LongCite模型来分析政府发布的长篇环境报告。模型不仅能够回答你关于政策的具体问题，还能提供报告中具体句子的引用，这样你的文章就会包含准确的信息和来源，增加文章的权威性。

GitHub：https://github.com/THUDM/LongCite
数据：https://huggingface.co/datasets/THUDM/LongCite-45k
模型：https://huggingface.co/THUDM/LongCite-glm4-9b和https://huggingface.co/THUDM/LongCite-llama3.1-8b
Demo：https://huggingface.co/spaces/THUDM/LongCite

LongCite：旨在提升大语言模型在长文本环境下生成引用的能力

主要功能：

LongCite的主要功能是让语言模型在回答用户问题时，能够提供具体的句子级引用，这些引用直接指向原文中的相关句子，使用户能够轻松验证模型回答的准确性。

主要特点：

自动生成引用： LongCite能够自动从大量文本中提取相关信息，并生成精确的句子级引用。
提高可信度： 通过提供具体的文本引用，增强了模型输出的可信度，使用户更有信心。
减少“幻觉”问题： 即模型生成与原文不符的信息，通过精确引用减少这种情况。

工作原理：

LongCite采用了一个名为CoF（Coarse to Fine）的流程，该流程分为几个步骤：

生成问题和答案： 首先，模型根据给定的长文本生成问题和答案。
生成粗略的块级引用： 利用答案中的句子，从文本中检索相关的块，并在答案中插入块级引用。
提取精细的句子级引用： 从每个块中提取支持答案的关键句子，形成句子级引用。
数据过滤： 过滤掉引用过少的实例，确保每个答案都有足够的引用支持。

具体应用场景：

学术研究： 学者可以使用LongCite来生成带有详细引用的文献综述，提高研究的准确性和可信度。
法律分析： 在法律领域，LongCite可以帮助分析大量案件文档，并提供精确的法律条文引用。
新闻报道： 记者可以使用LongCite来撰写报道，确保所有事实都有准确的来源引用，提高报道的可靠性。

LongCite

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：新型多模态大语言模型LongLLaVA：专门设计用于高效处理大量图像

下一篇：日本NTT推出声音转换技术FastVoiceGrad

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录