当前位置：首页 > 优惠 >大语言模型>文章详情

FLUTE：专门为使用查找表量化（LUT-quantized）的大语言模型设计

推荐人：暴走AI| 商城: AI | 12个月前 (07-22)| 分类：大语言模型 | 热度：327 ℃

已关闭评论

麻省理工学院、普罗夫迪夫数学高中和卡内基梅隆大学的研究人员推出FLUTE，FLUTE是一个灵活的查找表引擎，专门为使用查找表量化（LUT-quantized）的LLMs设计。简单来说，量化就是一种数据压缩技术，可以减少模型大小，加快运算速度，但同时也可能影响模型的精度。

大型语言模型是人工智能领域的一个热点，它们能够理解和生成人类语言，但这些模型往往需要大量的计算资源和内存带宽。论文中提到，部署这些模型时，主要的瓶颈是内存带宽，即把模型参数从GPU的全局内存传输到寄存器的成本很高。

例如，我们想在智能手机上部署一个能够回答问题的聊天机器人，但由于手机的内存和处理能力有限，直接部署完整的大型语言模型可能不太现实。这时，FLUTE就可以通过量化技术减小模型大小，同时保持较高的运行效率，使得机器人能够在手机上流畅运行。

FLUTE

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：研究编码基准测试SciCode：评估和提高语言模型在解决真实科学问题方面的能力

下一篇： PlacidDreamer：用于将文本转换成3D模型的先进框架

暂时木有评论

查看更多商品