Priority Sampling:提高大语言模型(LLMs)在编译器中的性能

分类:大语言模型 | 热度:122 ℃

Meta AI发布论文介绍了一种名为“Priority Sampling”的新技术,它用于提高大语言模型(LLMs)在编译器中的性能。大语言模型是一种人工智能技术,可以理解和生成自然语言,甚至编程语言的代码。假设你正在开发一个程序,需要优化以减少内存使用。你可以使用这个技术来生成多种可能的优化方案,然后选择最有效的那个。这就像是有一个智能的代码优化顾问,它能够提供多种解决方案,让你选择最佳的那一个。

论文地址:https://arxiv.org/abs/2402.18734

主要功能:

  • 生成和优化代码:这项技术可以帮助生成多种代码解决方案,然后从中选择最佳的。
  • 提高多样性:通过增加生成过程中的多样性,可以探索不同的编程思路。
  • 确定性采样:与随机采样不同,Priority Sampling能够保证生成的样本是唯一的,并且是模型最有信心的。

主要特点:

  • 简单且确定性:这种采样技术是简单的,并且能够产生有序的、基于模型信心的样本。
  • 支持正则表达式:这意味着可以根据特定的规则来生成代码,使得生成过程更加可控和结构化。
  • 高效性能:相比于现有的Nucleus Sampling方法,Priority Sampling在样本效率上更高,能够用更少的样本达到更好的性能。

工作原理:

  • 通过构建一个增强的搜索树,Priority Sampling决定接下来扩展哪个未探索的路径。
  • 在生成过程中,它会保存最有可能的K个备选标记(token)及其前缀,并根据这些标记的概率进行排序。
  • 当一个样本完全生成后,可以快速找到具有最高概率的标记前缀,并从那里扩展搜索树。
  • 通过这种方式,每个新样本都是唯一的,并且遵循模型的高信心方向。

具体应用场景:

  • 代码优化:在LLVM优化传递任务中,模型被训练来预测由长时间运行的自动调优器发现的优化。
  • 软件工程:在软件工程领域,这项技术可以用于生成代码和文档,翻译编程语言,编写单元测试,以及检测和修复bug。

 

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论