大语言模型
优惠 Google DeepMind推出结合了Transformer和神经算法推理器的混合模型TransNAR
5个月前 (06-16)AI
Google DeepMind推出一种结合了Transformer和神经算法推理器(Neural Algorithmic Reasoners,简称NARs)的混合模型,称为TransNAR。这种模型旨在提升机器学习在处理自然语言理解(NLU)任务时的算法推理能力。通过在CLRS-Text基准测试上的实验表明,Trans... 阅读全文
优惠 ShiftAddLLM:通过后训练的位移加法重参数化技术来加速预训练的大语言模型
标签:ShiftAddLLM
AI
5个月前 (06-11)AI
佐治亚理工学院 和Google DeepMind的研究人员推出ShiftAddLLM,它通过后训练的位移加法重参数化技术来加速预训练的大语言模型(LLMs)。这种方法旨在解决大语言模型在部署到资源受限设备时所面临的挑战,如高内存需求和延迟瓶颈。例如,你正在开发一款智能家居助手,需要使用大型语言模型来进行语音识别和自然语... 阅读全文