当前位置：首页 > 优惠 >大语言模型>文章详情

用于压缩大语言模型提示词的新方法LLMLingua-2

推荐人：暴走AI| 商城: AI | 1年前 (2024-03-20)| 分类：大语言模型 | 热度：304 ℃

已关闭评论

用于压缩大语言模型提示词的新方法LLMLingua-2

AI

来自清华和微软的研究团队推出LLMLingua-2，它是一种用于压缩大语言模型（LLMs）提示词（prompts）的新方法，目的是在不丢失关键信息的同时提高效率和泛化能力。在大语言模型的使用中，提示词通常是一段文本，用来引导模型生成特定的输出或完成特定的任务。然而，这些提示可能会非常长，导致计算成本增加和信息感知能力下降。LLMLingua-2通过压缩这些提示，使得模型能够在保持原有功能的同时，减少计算资源的消耗。

项目主页：https://llmlingua.com/llmlingua2.html

GitHub：https://github.com/microsoft/LLMLingua

Demo：https://huggingface.co/spaces/microsoft/llmlingua-2

用于压缩大语言模型提示词的新方法LLMLingua-2

主要功能和特点：

任务无关的压缩： LLMLingua-2不依赖于特定任务的信息，因此具有更好的泛化能力。
数据蒸馏： 通过从大型语言模型（如GPT-4）中提取知识，构建了一个用于文本压缩的数据集。
高效的压缩算法： 将提示压缩问题形式化为一个令牌分类问题，确保压缩后的提示与原始内容保持忠实。
低延迟： 使用Transformer编码器作为基础架构，通过明确学习压缩目标来降低模型的延迟。

工作原理： LLMLingua-2通过以下步骤工作：

数据蒸馏： 使用GPT-4生成压缩文本，然后通过特定的指令和质量控制过滤来构建数据集。
数据标注： 为原始文本中的每个单词分配一个标签，指示它在压缩后是否应该保留。
压缩器训练： 使用Transformer编码器作为特征提取器，训练一个分类模型来预测每个令牌的保留概率。
提示压缩： 根据分类模型预测的概率，保留概率最高的令牌，形成压缩后的提示。

具体应用场景：

会议摘要： 压缩会议记录，以便快速理解和回顾会议内容。
问答系统： 压缩问题和答案的上下文，提高问答系统的响应速度和效率。
知识密集型任务： 在需要处理大量文本信息的场景中，如法律文件分析或学术研究，压缩文本可以更快地提取关键信息。

总的来说，LLMLingua-2是一个强大的工具，它通过压缩大型语言模型的提示，提高了模型的效率和泛化能力，同时保持了输出的准确性和完整性。

LLMLingua-2

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：谷歌发布GaussianFlow：用于创建4D动态内容的新技术

下一篇：阿里推出DocOwl 1.5模型：用于理解文档图像的多模态大语言模型

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录