人工智能

优惠 MIRAGE:利用模型内部信息来确保大语言模型生成的答案能够准确引用支持文档

  • MIRAGE:利用模型内部信息来确保大语言模型生成的答案能够准确引用支持文档
    AI
  • 格罗宁根大学语言与认知中心 (CLCG)和阿姆斯特丹大学逻辑、语言与计算研究所 (ILLC)的研究人员推出MIRAGE(Model Internals-based RAG Explanations),它利用模型内部信息来确保大语言模型(LLMs)生成的答案能够准确引用支持文档。关于提高检索增强型生成(Retrieval... 阅读全文

    优惠 Latent Diffusion Models:用于在极短的时间内从2D图像数据高效生成3D场景

  • Latent Diffusion Models:用于在极短的时间内从2D图像数据高效生成3D场景
    AI
  • 格拉斯哥大学和爱丁堡大学的研究人员推出新技术Latent Diffusion Models,用于在极短的时间内从2D图像数据高效生成3D场景。这项技术的核心是一种自编码器,它能够将多视角的2D图像映射到3D高斯Splats,同时构建这些Splats的压缩潜在表示。简单来说,就是通过一个智能的转换过程,把平面的多角度图片... 阅读全文

    优惠 新型自主强化学习方法DigiRL:专门用于训练能够在现实世界环境控制设备(如智能手机等)的智能代理

  • 新型自主强化学习方法DigiRL:专门用于训练能够在现实世界环境控制设备(如智能手机等)的智能代理
    AI
  • 加州大学伯克利分校、伊利诺伊大学伯克利分校和谷歌 DeepMind的研究人员推出新型自主强化学习方法DigiRL,它专门用于训练能够在野外(即现实世界环境)控制设备(如智能手机等)的智能代理。这些智能代理可以通过图形用户界面(GUI)执行各种任务,比如网上购物、预订旅行或者操作移动设备等。 项目主页:https://d... 阅读全文

    优惠 新基准测试工具τ-bench:专门用来评估语言代理(智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力

  • 新基准测试工具τ-bench:专门用来评估语言代理(智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力
    AI
  • Sierra推出新基准测试工具τ-bench,它专门用来评估语言代理(也就是我们通常所说的智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力。这就像是给智能助手们进行一次全面的“模拟考试”,看看它们在实际工作中的表现如何。例如,你是一个航空公司的智能助手,用户想要更改他们的航班预订。你需要通过与用户的对话了... 阅读全文

    优惠 新型基准测试工具REPOEXEC:用于评估代码生成模型在处理整个代码库级别的任务时的能力

  • 新型基准测试工具REPOEXEC:用于评估代码生成模型在处理整个代码库级别的任务时的能力
    AI
  • 越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型基准测试工具REPOEXEC,它用于评估代码生成模型(CodeLLMs)在处理整个代码库级别的任务时的能力。REPOEXEC的核心目标是测试这些模型生成的代码是否可执行、功能正确,并且能够准确利用跨文件的上下文信息。实验结果表明,尽管预训练的大型语言模型(LL... 阅读全文

    优惠 新型预训练方法“指令预训练(Instruction Pre-Training)”:通过在原始语料库中加入指令-响应对来增强传统的语言模型的预训练过程

  • 新型预训练方法“指令预训练(Instruction Pre-Training)”:通过在原始语料库中加入指令-响应对来增强传统的语言模型的预训练过程
    AI
  • 微软研究院和清华大学的研究人员推出一种新型的预训练方法,名为“指令预训练”(Instruction Pre-Training),这种方法通过在原始语料库中加入指令-响应对来增强传统的语言模型(LMs)的预训练过程。指令-响应对是由一个高效的指令合成器生成的,该合成器基于开源模型构建。论文的实验结果表明,指令预训练在多种... 阅读全文

    优惠 大语言模型中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息

  • 大语言模型中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息
    AI
  • 华南理工大学、多伦多大学、巴伊兰大学、中国国际数字经济学院 (IDEA) 和特拉维夫大学的研究人员发布论文,论文的主题是探讨在大语言模型(LLMs)中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息。这项研究非常重要,因为它有助于减轻模型可能产生的不良影响,例如生成有害、私密或错误的信息。 主要... 阅读全文

    优惠 自监督语音模型的接口设计

  • 自监督语音模型的接口设计
    AI
  • 美国德克萨斯大学奥斯汀分校计算机科学系的研究人员发布论文,论文的主题是关于自监督语音模型(Self-Supervised Speech Learning, SSL)的接口设计。自监督语音模型是一种通过大量未标记数据进行预训练,然后在少量标记数据上进行微调,以完成特定下游任务的模型。这些模型在自动语音识别等语音处理任务中... 阅读全文

    优惠 模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现

  • 模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现
    AI
  • 印度理工学院、美国国家标准与技术研究所和新加坡科技设计大学的研究人员发布论文,论文的主题是探讨模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现。模型编辑技术允许我们对预训练语言模型(PLMs)进行微调,以便它们能够更好地适应特定的输入和需求。这项技术在英文环境中已经取得了显著的成果,但同时也暴露了语言间的不平... 阅读全文

    优惠 新型大语言模型Self-MoE:将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统

  • 新型大语言模型Self-MoE:将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统
    AI
  • 佐治亚理工学院、MIT-IBM Watson AI 实验室、麻省理工学院、加州大学圣地亚哥分校和MBZUAI的研究人员发布新型大语言模型Self-MoE,它将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统,这些专家被称为MiXSE(MiXture of Self-specialized Experts,即自... 阅读全文

    优惠 Snap公司发布了Lens Studio 5.0,引入了GenAI套件和插件支持

  • Snap公司发布了Lens Studio 5.0,引入了GenAI套件和插件支持
    AI
  • Snap公司推出了Lens Studio 5.0版本,引入了重大的增强功能,旨在推进增强现实(AR)创作。该更新特有GenAI Suite,它整合了机器学习工具和3D资产生成,通过文本或图像提示简化AR创作。新版本支持插件系统,允许开发者扩展编辑器的功能并定制工作流程。这次更新速度提升了18倍,增强了开发者的生产力和模... 阅读全文

    优惠 B站开源了轻量级 Index-1.9B 系列模型:包含基座模型、对照组、对话模型、角色扮演模型等多个版本

  • B站开源了轻量级 Index-1.9B 系列模型:包含基座模型、对照组、对话模型、角色扮演模型等多个版本
    AI
  • B站昨日开源了轻量级 Index-1.9B 系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。据介绍,该模型在预训练阶段使用了 2.8T 规模的数据,中英比例为 4:5,代码占比 6%。目前,角色扮演模型内置了角色“三三”,用户也可以按需创建自己的角色。 GitHub:https://github.co... 阅读全文