人工智能

优惠 数据集大小恢复DSiRe:从模型的权重中直接确定训练模型时使用的样本数量

  • 数据集大小恢复DSiRe:从模型的权重中直接确定训练模型时使用的样本数量
    AI
  • 耶路撒冷希伯来大学的研究人员推出DSiRe(数据集大小恢复,Dataset Size Recovery),旨在从模型的权重中直接确定训练模型时使用的样本数量。具体来说,研究者们专注于在使用低秩适应(LoRA)微调模型的情况下,恢复用于微调的数据集大小。LoRA是一种流行的微调技术,它通过添加低秩权重矩阵来调整预训练模型... 阅读全文

    优惠 新技术框架DPA-RAG:解决大语言模型在进行检索增强型生成任务时面临的知识偏好不一致问题

  • 新技术框架DPA-RAG:解决大语言模型在进行检索增强型生成任务时面临的知识偏好不一致问题
    AI
  • 中国人民大学高岭人工智能学院和北京邮电大学人工智能学院的研究人员推出新技术框架DPA-RAG(Dual Preference Alignment for Retrieval-Augmented Generation),旨在解决大语言模型(LLMs)在进行检索增强型生成任务时面临的知识偏好不一致问题。简单来说,大型语言模... 阅读全文

    优惠 T-FREE:解决大语言模型在文本编码方面的一些固有问题

  • T-FREE:解决大语言模型在文本编码方面的一些固有问题
    AI
  • 达姆施塔特工业大学、黑森人工智能中心 (hessian.AI)和德国人工智能中心 (DFKI)的研究人员推出新技术T-FREE(Tokenizer-Free Generative Large Language Models via Sparse Representations),它旨在解决大语言模型(LLMs)在文本编... 阅读全文

    优惠 AUTOHALLUSION:为视觉-语言模型自动生成幻觉基准测试

  • AUTOHALLUSION:为视觉-语言模型自动生成幻觉基准测试
    AI
  • 马里兰大学帕克分校的研究人员推出AUTOHALLUSION,这是一种为视觉-语言模型(Vision-Language Models,简称LVLMs)自动生成幻觉基准测试的方法。简单来说,LVLMs是一种人工智能,它们可以同时处理图像和语言信息,比如理解图片内容并根据图片生成描述文字。但问题是,这些模型有时会"幻想"出一... 阅读全文

    优惠 MoA:用于自动压缩大语言模型的新方法

  • MoA:用于自动压缩大语言模型的新方法
    AI
  • 清华大学、无问芯穹、斯坦福大学和上海交通大学的研究人员推出MoA(Mixture of Sparse Attention),它是一种用于自动压缩大语言模型(LLMs)的新方法。MoA的核心思想是通过稀疏注意力机制来减轻大型语言模型在处理长文本时对内存和吞吐量的高需求。以往的稀疏注意力方法通常采用统一的模式,对所有注意力... 阅读全文

    优惠 自感知知识检索SEAKR:为大语言模型设计的自适应检索增强生成策略,减少大型语言模型在生成文本时出现的幻觉问题

  • 自感知知识检索SEAKR:为大语言模型设计的自适应检索增强生成策略,减少大型语言模型在生成文本时出现的幻觉问题
    AI
  • 来自清华大学人工智能研究所、加州大学圣巴巴拉分校、北京理工大学和西门子科技数据与人工智能集团的研究人员推出“SEAKR”,即自感知知识检索(Self-aware Knowledge Retrieval),这是一种为大语言模型(LLMs)设计的自适应检索增强生成(Adaptive Retrieval-Augmented ... 阅读全文

    优惠 STEP-DPO:解决大语言模型在进行长链条数学推理时所面临的挑战

  • STEP-DPO:解决大语言模型在进行长链条数学推理时所面临的挑战
    AI
  • 香港中文大学、哈尔滨工业大学(深圳)和SmartMore的研究人员推出新方法STEP-DPO(Step-wise Preference Optimization),它旨在解决大语言模型(LLMs)在进行长链条数学推理时所面临的挑战。长链条数学推理要求模型进行一系列精确且连贯的逻辑步骤,以确保最终答案的正确性。然而,现有... 阅读全文

    优惠 新型人工智能框架OMG-LLaVA:能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起

  • 新型人工智能框架OMG-LLaVA:能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起
    AI
  • 武汉大学、天工AI和南洋理工大学的研究人员推出新型人工智能框架OMG-LLaVA,它能够将图像级别的理解、物体级别的识别和像素级别的分析整合在一起。简单来说,OMG-LLaVA就像是一个超级聪明的图像处理助手,它不仅能看懂图片里有什么,还能理解图片中物体之间的关系,甚至能根据文字指令来处理图片。 项目主页:https:... 阅读全文

    优惠 国内开发者免费!字节跳动发布 AI 编程助手豆包 MarsCode

  • 国内开发者免费!字节跳动发布 AI 编程助手豆包 MarsCode
    AI
  • 字节跳动昨日在北京发布了 AI 开发工具 —— 豆包 MarsCode,向国内开发者免费开放。豆包 MarsCode 编程助手,以智能代码补全为特色的 AI 功能,支持多种操作系统(Windows、macOS、Linux)、编程语言及主流 IDE(Visual Studio Code 与 JetBrains),在开发过... 阅读全文

    优惠 统一框架AUTODETECT:专门设计来自动检测大语言模型中的弱点

  • 统一框架AUTODETECT:专门设计来自动检测大语言模型中的弱点
    AI
  • 清华大学和智谱推出统一框架AUTODETECT,它专门设计来自动检测大语言模型(LLMs)中的弱点。例如,你有一个非常聪明的AI助手,它可以做很多复杂的事情,比如解决数学问题或者编写代码,但可能在某些看似简单的任务上犯错。AUTODETECT就像一个AI助手的教练,能够找出AI在哪些方面表现不佳,并提供改进的建议。 G... 阅读全文

    优惠 ClotheDreamer:根据文本提示生成高保真的3D服装资产

  • ClotheDreamer:根据文本提示生成高保真的3D服装资产
    AI
  • 上海大学、上海交通大学、复旦大学和腾讯优图实验室的研究人员推出创新系统ClotheDreamer,它能够根据文本提示生成高保真的3D服装资产。你只需要用文字描述你想要的衣服样式,比如“一件银色的蓬松夹克和相配的裤子”,ClotheDreamer就能在虚拟空间中创造出这件衣服,甚至还能模拟衣服的穿着效果和动画。如果你是一... 阅读全文

    优惠 新型交互式真实机器人动作模拟器IRASim:利用生成模型的能力,从给定的初始帧和动作轨迹生成极其逼真的机器人臂部执行动作的视频

  • 新型交互式真实机器人动作模拟器IRASim:利用生成模型的能力,从给定的初始帧和动作轨迹生成极其逼真的机器人臂部执行动作的视频
    AI
  • 字节跳动研究院和香港科技大学的研究人员推出新型交互式真实机器人动作模拟器IRASim,这个模拟器的核心功能是利用生成模型的能力,从给定的初始帧和动作轨迹生成极其逼真的机器人臂部执行动作的视频。简单来说,IRASim就像一个高级的“虚拟导演”,能够根据提供的场景和动作指令,预演出机器人完成任务的过程。 项目主页:http... 阅读全文