人工智能
优惠 Meta推出Branch-Train-MiX(BTX):效的训练大语言模型的方法,旨在让模型在多个专业领域(如编程、数学推理和世界知识等)都具备能力
9个月前 (03-13)AI
Meta推出Branch-Train-MiX(BTX),它是一种高效的训练大语言模型(LLMs)的方法,旨在让模型在多个专业领域(如编程、数学推理和世界知识等)都具备能力。BTX方法从一个基础模型开始,然后将其分支出去,以并行的方式训练各个专家模型,这样做的通信成本较低,吞吐量高。训练完成后,BTX将这些专家模型的前馈... 阅读全文
优惠 新型动作生成模型Motion Mamba:专注于高效地生成长时间序列的人类动作
标签:Motion Mamba
AI
9个月前 (03-13)AI
这篇论文介绍了一个名为Motion Mamba的新型动作生成模型,它专注于高效地生成长时间序列的人类动作。Motion Mamba是一个强大的工具,它通过结合先进的状态空间模型和扩散模型,为长时间序列的人类动作生成提供了一个高效且高质量的解决方案。想象一下,你正在为一个视频游戏设计角色动作,或者为一个动画电影创建复杂的... 阅读全文
优惠 OpenAI开源Transformer结构分析工具Transformer Debugger(TDB)
9个月前 (03-12)AI
被马斯克喷了很久的OpenAI,在今天开源了一个自己内部一直用于分析Transformer内部结构的工具Transformer Debugger(TDB),该工具结合了自动可解释性和稀疏自动编码器,允许开发者快速探索模型而无需编写代码。 Transformer Debugger(TDB)是由OpenAI的Superal... 阅读全文