LLoCO

栏目分类

推荐人：暴走AI 标签：LLoCO 大语言模型 AI

1年前 (2024-04-12)AI

加州大学伯克利分校的研究人员推出新技术LLoCO（Learning Long Contexts Offline），旨在解决大语言模型（LLMs）处理长文本时遇到的挑战。由于自注意力机制的计算和内存开销随序列长度增加而呈二次方增长，以及生成过程中庞大的键值（KV）缓存大小，处理长文本对LLMs来说一直是个难题。主要功能... 阅读全文

直达链接好 0 不好 0 已关闭评论