大语言模型
优惠 新型二值化技术“Mixture of Scales”:用于压缩大语言模型
5个月前 (06-19)AI
首尔国立大学、 SqueezeBits和成均馆大学的研究人员推出新型二值化技术“Mixture of Scales”(简称BinaryMoS),它主要用于压缩大语言模型(LLMs)。二值化是一种将模型中的权重参数转换为二进制值的方法,可以显著减少模型的大小,但传统的二值化技术会牺牲模型的语言能力。BinaryMoS通过... 阅读全文
优惠 评估平台OlympicArena:专门用来测试和衡量AI模型在解决高难度问题时的认知推理能力
标签:OlympicArena
AI
5个月前 (06-19)AI
上海交通大学、上海人工智能实验室、 生成式人工智能研究实验室(GAIR)的研究人员推出评估平台OlympicArena,它专门用来测试和衡量人工智能(AI)模型在解决高难度问题时的认知推理能力。这些问题的难度级别相当于奥林匹克竞赛水平,涵盖了多个学科领域。 项目主页:https://gair-nlp.github.io... 阅读全文