当前位置：首页 > 优惠 >大语言模型>文章详情

IBM推出新型大语言模型Larimar：通过引入一个分布式的情节记忆系统来增强LLM的能力

推荐人：暴走AI| 商城: AI | 1年前 (2024-03-20)| 分类：大语言模型 | 热度：261 ℃

已关闭评论

IBM推出新型大语言模型Larimar：通过引入一个分布式的情节记忆系统来增强LLM的能力

AI

IBM推出新型大语言模型Larimar，它通过引入一个分布式的情节记忆系统来增强LLM的能力。Larimar的记忆系统允许动态、一次性地更新知识，而不需要进行计算成本高昂的重新训练或微调。例如，如果我们有一个提供天气预报的AI助手，当一个新的风暴形成时，我们希望能够快速更新模型的天气预报数据。使用Larimar，我们可以简单地将新的风暴信息写入其记忆模块，然后模型就会根据这些更新的信息生成最新的预报，而不需要重新训练整个模型。这样，用户就可以获得最准确的天气预报。

主要功能和特点：

高效知识更新： Larimar能够快速准确地更新存储在LLM中的知识，这对于保持模型的最新状态和适应新信息至关重要。
速度快： 与现有的竞争基线相比，Larimar在执行单次和连续事实编辑任务时，速度提升了4-10倍。
灵活性： 由于其架构简单、与LLM无关，因此具有很高的通用性，可以应用于不同的LLM。
选择性遗忘： Larimar提供了机制来忘记特定的事实，这对于删除过时或敏感信息非常有用。

工作原理：

记忆模块： Larimar使用一个外部的情节记忆控制器，该控制器作为一个全局存储，记录当前的事实更新或编辑。
一次性更新： 当新的编辑到来时，可以高效地更新这个记忆模块，而不需要进行任何训练。
记忆条件解码： 更新后的记忆模块随后被用作条件，以影响LLM的解码过程，从而产生编辑后的输出。

具体应用场景：

实时知识更新： 在需要快速响应新信息或数据的场景中，如新闻摘要、实时问答系统等，Larimar可以提供及时的知识更新。
内容审查： 对于需要删除或修改敏感内容的平台，Larimar的选择性遗忘功能可以帮助快速移除不当信息。
个性化推荐： 在个性化推荐系统中，Larimar可以动态更新用户偏好和历史行为，以提供更准确的推荐。

IBM Larimar

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：谷歌发布“参数高效强化学习（PERL）”：通过人类反馈来高效地训练大语言模型，使其更好地符合人类的偏好

下一篇：大型多模态模型LLaVA-UHD：能够高效地处理任意宽高比和高分辨率的图像

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录