大语言模型
优惠 RESONANCE RoPE(共振旋转位置编码):改善大语言模型(LLMs)在处理长文本时的性能
10个月前 (03-04)AI
来自蒙特利尔大学、魁北克人工智能研究所、华为诺亚方舟实验室的研究人员发布论文介绍了一种名为RESONANCE RoPE(共振旋转位置编码)的技术,它旨在改善大语言模型(LLMs)在处理长文本时的性能。在训练时,模型通常处理较短的文本序列,但在实际应用中可能需要处理更长的文本,这就是所谓的“训练短-测试长”(TSTL)场... 阅读全文
优惠 Priority Sampling:提高大语言模型(LLMs)在编译器中的性能
10个月前 (03-02)AI
Meta AI发布论文介绍了一种名为“Priority Sampling”的新技术,它用于提高大语言模型(LLMs)在编译器中的性能。大语言模型是一种人工智能技术,可以理解和生成自然语言,甚至编程语言的代码。假设你正在开发一个程序,需要优化以减少内存使用。你可以使用这个技术来生成多种可能的优化方案,然后选择最有效的那个... 阅读全文