韩国科学技术研究院推出新方法TroL(Traversal of Layers,即层次遍历),它用于提升大型语言和视觉模型(LLVMs)的效率和性能。TroL的核心思想是通过在模型中重复使用层(即“层次遍历”),来模拟人类在回答问题时回顾和重新审视信息的过程,从而在不增加额外计算负担的情况下提高模型的理解和生成能力。论文... 阅读全文
首尔国立大学、 SqueezeBits和成均馆大学的研究人员推出新型二值化技术“Mixture of Scales”(简称BinaryMoS),它主要用于压缩大语言模型(LLMs)。二值化是一种将模型中的权重参数转换为二进制值的方法,可以显著减少模型的大小,但传统的二值化技术会牺牲模型的语言能力。BinaryMoS通过... 阅读全文