AI

优惠 新的流匹配方法Consistency-FM:用于生成模型的算法框架

  • 新的流匹配方法Consistency-FM:用于生成模型的算法框架
    AI
  • “Consistency Flow Matching”(Consistency-FM)这是一种新的流匹配(Flow Matching, FM)方法,一种用于生成模型的算法框架。这种方法的核心在于通过普通微分方程(ODEs)定义概率路径,从而在噪声和数据样本之间进行转换。Consistency-FM特别强调在速度场中显式... 阅读全文

    优惠 MInference:加速大语言模型的预填充(pre-filling)阶段,特别是在处理长文本时

  • MInference:加速大语言模型的预填充(pre-filling)阶段,特别是在处理长文本时
    AI
  • 微软公司和 萨里大学的研究人员推出新技术MInference(Million-tokens Inference),它旨在加速大语言模型的预填充(pre-filling)阶段,特别是在处理长文本时。预填充阶段是LLMs生成文本前的一个重要步骤,但当文本长度增加时,这一阶段的计算成本会变得非常高。 项目主页:https:/... 阅读全文

    优惠 AGENTLESS:基于大语言模型的软件工程自动化方法,简化软件开发任务,如代码合成、程序修复和测试生成

  • AGENTLESS:基于大语言模型的软件工程自动化方法,简化软件开发任务,如代码合成、程序修复和测试生成
    AI
  • 伊利诺伊大学香槟分校的研究人员推出AGENTLESS系统,它是一种基于大语言模型的软件工程自动化方法,旨在简化软件开发任务,如代码合成、程序修复和测试生成。AGENTLESS的核心思想是去掉复杂的自主软件代理(agents),这些代理过去被用来执行端到端的软件开发任务,包括使用工具、运行命令、观察环境反馈和规划未来行动... 阅读全文

    优惠 大规模高质量文本到视频生成数据集OpenVid-1M以及多模态视频扩散变换器MVDiT

  • 大规模高质量文本到视频生成数据集OpenVid-1M以及多模态视频扩散变换器MVDiT
    AI
  •  南京大学、字节跳动和南开大学的研究人员推出大规模高质量文本到视频生成数据集OpenVid-1M,以及一个新颖的多模态视频扩散变换器(MVDiT)。论文还提到了MVDiT的一些限制,比如在模拟复杂自然场景的动态和运动时可能会产生不真实的视频,以及目前还不能模拟长时间动态,这些都是未来研究需要解决的问题。 项目主页:ht... 阅读全文

    优惠 Meta推出Meta 3D Gen:1 分钟内生成高质量 3D 资产

  • Meta推出Meta 3D Gen:1 分钟内生成高质量 3D 资产
    AI
  • Meta推出Meta 3D Gen(简称3DGen)的先进技术,它是一个文本到3D资产生成的快速通道。这项技术的主要特点是能够快速生成高质量的3D模型和纹理,几乎达到了一分钟以内的惊人速度。3DGen支持基于物理的渲染(PBR),这对于3D资产在现实世界应用中的重新照明至关重要。此外,3DGen还能够使用用户提供的额外... 阅读全文

    优惠 Step-Controlled DPO:提升大语言模型在数学推理等下游任务上的表现

  • Step-Controlled DPO:提升大语言模型在数学推理等下游任务上的表现
    AI
  • 香港中文大学多媒体实验室推出新方法Step-Controlled DPO(SCDPO),用于提升大语言模型(LLMs)在数学推理等下游任务上的表现。例如,我们有一个超级聪明的电脑助手,它可以理解和解决复杂的数学问题,但有时它可能会在解题过程中出错。SCDPO的作用就是帮助这个电脑助手更准确地理解问题并找到正确的解题步骤... 阅读全文

    优惠 REGMIX:将数据混合问题转化为一个回归问题来解决

  • REGMIX:将数据混合问题转化为一个回归问题来解决
    AI
  • Sea推出新方法REGMIX,它将数据混合问题转化为一个回归问题来解决。简单来说,就是通过训练多个小型模型,并观察它们在不同数据混合下的表现,然后基于这些表现来预测哪些数据混合对于训练大型模型最有效。例如,我们想训练一个能够回答各种问题的语言模型。我们有来自不同领域(如科学、历史、技术)的大量文本数据。使用REGMIX... 阅读全文

    优惠 新型树状搜索算法LiteSearch:为了提高大语言模型在复杂数学推理任务上的性能而设计

  • 新型树状搜索算法LiteSearch:为了提高大语言模型在复杂数学推理任务上的性能而设计
    AI
  • 厦门大学信息学院和腾讯人工智能实验室的研究人员推出一种新型的树状搜索算法——LiteSearch,它是为了提高大语言模型(LLMs)在复杂数学推理任务上的性能而设计的。在以往的研究中,树状搜索算法(例如蒙特卡洛树搜索,MCTS)已被证明可以显著提升LLMs的性能,但这些算法常常因为搜索策略上的浪费而需要超过贪婪解码10... 阅读全文

    优惠 新型多模态评估基准MMEVALPRO:检验和校准大型多模态模型的评估方法,以确保评估结果既可靠又高效

  • 新型多模态评估基准MMEVALPRO:检验和校准大型多模态模型的评估方法,以确保评估结果既可靠又高效
    AI
  • 北京大学、国医学科学院、香港中文大学和阿里巴巴集团的研究人员推出新型多模态评估基准MMEVALPRO,它专门设计用来检验和校准大型多模态模型(LMMs)的评估方法,以确保评估结果既可靠又高效。例如,我们有一个问题:“图中的植物有几种不同的叶子形状?”原始答案可能是“三种”。但MMEVALPRO会进一步询问:“你能描述这... 阅读全文

    优惠 用于机器人编程的系统ROS-LLM:可以让没有专业机器人编程知识的普通人通过自然语言提示和上下文信息来指导机器人完成任务

  • 用于机器人编程的系统ROS-LLM:可以让没有专业机器人编程知识的普通人通过自然语言提示和上下文信息来指导机器人完成任务
    AI
  • 华为诺亚方舟的研究人员推出ROS-LLM框架,它是一个用于机器人编程的系统,可以让没有专业机器人编程知识的普通人通过自然语言提示和上下文信息来指导机器人完成任务。简单来说,这个系统就像是一个能够理解人类语言的机器人大脑,它能够根据人们用日常语言描述的任务要求来控制机器人的动作。 GitHub:https://githu... 阅读全文

    优惠 基准测试WE-MATH:专门用来评估这些模型在解决视觉数学问题时所遵循的解题原则

  • 基准测试WE-MATH:专门用来评估这些模型在解决视觉数学问题时所遵循的解题原则
    AI
  • 北京邮电大学、 腾讯、华中科技大学和北京技术研究院的研究人员推出基准测试WE-MATH,测试大型多模态模型(Large Multimodal Models,简称LMMs)在进行数学推理时是否能达到类似人类的水平,专门用来评估这些模型在解决视觉数学问题时所遵循的解题原则,而不仅仅是最终结果。 项目主页:https://w... 阅读全文

    优惠 仅 200KB!开源在线白板工具Kinopio

  • 仅 200KB!开源在线白板工具Kinopio
    AI
  • kinopio-client 是GitHub上的一个开源白板工具,该项目专注于在线白板工具的开发。Kinopio是一个允许用户以多种方式连接许多卡片的在线白板工具。在项目的五周年纪念日,开发者宣布了这个项目的开源,使得用户能够在本地运行并使用Kinopio。整个项目的代码大小仅为220KB,这使得即使在缺乏互联网连接的... 阅读全文