人工智能

优惠 Zyphra推出新型混合模型Zamba:结合了SSM和Transformer的特点,提供与大型开放模型相媲美的性能,同时在参数成本上保持较低的水平

  • Zyphra推出新型混合模型Zamba:结合了SSM和Transformer的特点,提供与大型开放模型相媲美的性能,同时在参数成本上保持较低的水平
    AI
  • Zyphra推出新型人工智能语言模型Zamba,Zamba是一个7亿参数(7B SSM)的混合模型,它结合了SSM(State Space Model,状态空间模型)和Transformer的特点,旨在提供与大型开放模型相媲美的性能,同时在参数成本上保持较低的水平。论文还讨论了Zamba与其他模型的比较,以及它在不同基... 阅读全文

    优惠 如何让Transformer模型更好地执行数学运算,特别是大数字的加法

  • 如何让Transformer模型更好地执行数学运算,特别是大数字的加法
    AI
  • 马里兰大学、劳伦斯利弗莫尔国家实验室、蒂宾根埃利斯研究所、马克斯·普朗克智能系统研究所、图宾根人工智能中心和卡内基梅隆大学的研究人员发布论文,论文的主题是关于如何让一种名为“Transformer”的人工智能模型更好地执行数学运算,特别是大数字的加法。Transformer模型在处理语言和生成代码方面已经取得了很大进步... 阅读全文

    优惠 文本引导的2D头像生成框架InstructAvatar:能够根据自然语言指令来控制头像的表情和动作

  • 文本引导的2D头像生成框架InstructAvatar:能够根据自然语言指令来控制头像的表情和动作
    AI
  • 北京大学的研究人员推出类似阿里的Emo和微软的VASA-1的文本引导的2D头像生成框架InstructAvatar,它能够根据自然语言指令来控制头像的表情和动作。简单来说,InstructAvatar就像是一个虚拟的“演员”,可以根据你给它的文本提示,展现出各种细腻的表情和动作。 项目主页:https://wangyu... 阅读全文

    优惠 3D建模系统CraftsMan:能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节

  • 3D建模系统CraftsMan:能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节
    AI
  • 香港科技大学、腾讯AI实验室的研究人员推出新颖3D建模系统CraftsMan,它能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节。更重要的是,CraftsMan允许以交互式的方式对几何体进行细化。CraftsMan通过结合3D原生扩散模型和交互式几何细化技术,为3D建模领域带来了一个既... 阅读全文

    优惠 transformers模型是否能够学习隐式推理,即在没有明确指导的情况下对知识进行推理

  • transformers模型是否能够学习隐式推理,即在没有明确指导的情况下对知识进行推理
    AI
  • 俄亥俄州立大学 和卡内基梅隆大学的研究人员发布论文探讨了transformers,这是一种在自然语言处理(NLP)领域广泛使用的模型,是否能够学习隐式推理(implicit reasoning),即在没有明确指导的情况下对知识进行推理。隐式推理是一种能力,它允许模型在面对新的、未见过的情况时,能够运用已有的知识来做出合... 阅读全文

    优惠 新型大型语言模型AutoCoder:通过先进的人工智能技术,帮助人们更高效、更准确地编写代码

  • 新型大型语言模型AutoCoder:通过先进的人工智能技术,帮助人们更高效、更准确地编写代码
    AI
  • 康涅狄格大学和AIGCode推出新型大型语言模型AutoCoder,它在代码生成方面取得了显著的进展。总的来说,AutoCoder是一个强大的工具,它通过先进的人工智能技术,帮助人们更高效、更准确地编写代码,极大地推动了软件开发领域的发展。例如,你是一名软件开发者,需要编写大量代码来完成任务,这个过程可能会既耗时又容易... 阅读全文

    优惠 数据混合策略BIMIX:旨在提高语言模型预训练的效率

  • 数据混合策略BIMIX:旨在提高语言模型预训练的效率
    AI
  • 阿里推出一种新型的数据混合策略BIMIX(Bivariate Scaling Law for Language Model Pretraining),旨在提高语言模型预训练的效率。BIMIX的核心思想是通过精确地量化数据量和混合比例对模型性能的影响,来优化数据混合,从而提升训练效率和模型的泛化能力。 主要功能: 数据混... 阅读全文

    优惠 服务于23种语言!Cohere推出多语言语言模型家族Aya 23

  • 服务于23种语言!Cohere推出多语言语言模型家族Aya 23
    AI
  • Cohere推出多语言语言模型家族Aya 23,Aya 23基于Aya模型的最新发布,并结合了最近发布的Aya集合,旨在创建一个强大的多语言大型语言模型,服务于23种语言,将最先进的语言建模能力扩展到全球大约一半的人口。与之前的Aya 101模型涵盖101种语言不同,Aya 23是一次关于深度与广度的实验,探索在预训练... 阅读全文

    优惠 苹果推出去噪语言模型DLM:用于提高自动语音识别(ASR)系统性能的新技术

  • 苹果推出去噪语言模型DLM:用于提高自动语音识别(ASR)系统性能的新技术
    AI
  • 苹果推出去噪语言模型DLM(Denoising Language Model),用于提高自动语音识别(ASR)系统性能的新技术。DLM的核心思想是,通过训练一个模型来纠正ASR系统产生的错误,而不是仅仅重新排列ASR系统已经生成的假设(这是传统语言模型LM的做法)。 主要功能: 错误纠正:DLM专门设计用来修正ASR系... 阅读全文

    优惠 大型语言视觉模型Meteor:通过一种新颖的“理由遍历”(traversal of rationale)方法来增强理解和回答问题的能力

  • 大型语言视觉模型Meteor:通过一种新颖的“理由遍历”(traversal of rationale)方法来增强理解和回答问题的能力
    AI
  • 韩国科学院推出新型大型语言和视觉模型Meteor,它通过一种新颖的“理由遍历”(traversal of rationale)方法来增强理解和回答问题的能力。简而言之,Meteor是一个能够理解和回答各种视觉和语言问题的智能系统,它通过有效的理由遍历和多模态信息整合,在不需要增加模型复杂度的情况下,提高了问题回答的准确... 阅读全文

    优惠 新型人工智能模型iVideoGPT:可扩展的世界模型,能够模拟环境并帮助智能体(比如机器人)进行决策

  • 新型人工智能模型iVideoGPT:可扩展的世界模型,能够模拟环境并帮助智能体(比如机器人)进行决策
    AI
  • 清华大学北科院软件学院、清华大学致力学院、华为诺亚方舟实验室和天津大学智能与计算学院的研究人员推出新型人工智能模型iVideoGPT,它是一个可扩展的世界模型,能够模拟环境并帮助智能体(比如机器人)进行决策。例如,你有一台能够预测未来并帮你做出更好选择的神奇相机,iVideoGPT就有点像这样,但它是为机器人和计算机程... 阅读全文

    优惠 关于自动化数据整理在自监督学习中的应用

  • 关于自动化数据整理在自监督学习中的应用
    AI
  • Meta、INRIA、巴黎萨克雷大学和谷歌的研究人员发布论文,论文的主题是关于自动化数据整理(Automatic Data Curation)在自监督学习(Self-Supervised Learning, SSL)中的应用。自监督学习是一种无需人工标注数据的学习方法,它通过学习数据本身的结构和模式来训练模型,这在机器... 阅读全文