人工智能

优惠 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务

  • 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务
    AI
  • 越南FPT软件AI中心推出新型通用软件工程代理系统HyperAgent,这个系统能够自动执行多种编程任务,比如修复软件中的错误、添加新功能、改进代码质量等。与现有的基于LLM的软件代理不同,后者通常专注于特定任务,HyperAgent模仿人类开发者的工作流程,以应对多样化的SE挑战。它由四个专业代理组成(规划者、导航器... 阅读全文

    优惠 avsoundscape:能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的

  • avsoundscape:能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的
    AI
  • 加州大学伯克利分校、Meta和密歇根大学的研究人员推出Self-Supervised Audio-Visual Soundscape Stylization技术,它能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的。简单来说,就是可以通过这个技术,把一段语音处理得好像它是在某个特定环境中产生的,比如在... 阅读全文

    优惠 谷歌推出零样本跨语言声音转换技术Zero-shot Cross-lingual Voice Transfer

  • 谷歌推出零样本跨语言声音转换技术Zero-shot Cross-lingual Voice Transfer
    AI
  • 谷歌推出了一种名为“Zero-shot Cross-lingual Voice Transfer”(零样本跨语言声音转换)的技术,它可以将一个人的语音转换到另一种语言中去。简单来说,就是如果你有一种语言的语音样本,这项技术能够让你的声音听起来像是在说另一种你从未说过的语言。 项目主页:https://google.gi... 阅读全文

    优惠 微软研究院推出SpaceBlender系统:利用生成式AI来创造VR环境中的3D空间的工具

  • 微软研究院推出SpaceBlender系统:利用生成式AI来创造VR环境中的3D空间的工具
    AI
  • 微软研究院推出SpaceBlender系统,它是一个利用生成式人工智能(AI)来创造虚拟现实(VR)环境中的3D空间的工具。简单来说,SpaceBlender可以把用户周围的真实环境转换成3D虚拟环境,让用户在VR中体验到融合了现实世界元素的虚拟空间。 项目主页:https://nels.dev/publication... 阅读全文

    优惠 英伟达推出MaskedMimic:用于控制虚拟角色动作的人工智能系统

  • 英伟达推出MaskedMimic:用于控制虚拟角色动作的人工智能系统
    AI
  • 英伟达推出MaskedMimic,它是一个用于控制虚拟角色动作的人工智能系统。想象一下,我们想要创造一个能够根据我们给定的条件做出各种动作的虚拟角色,比如在虚拟现实游戏中的人物或者电影里的动画角色。MaskedMimic就是专门用来实现这一目标的。 项目主页:https://research.nvidia.com/la... 阅读全文

    优惠 用于逆向渲染的技术MaterialFusion:能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照

  • 用于逆向渲染的技术MaterialFusion:能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照
    AI
  • 卡内基梅隆大学和特拉维夫大学的研究人员推出一个用于逆向渲染的技术MaterialFusion,能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照。简而言之,MaterialFusion能够从一个物体在不同角度拍摄的多张图片中,推断出物体的三维形状、材质和光照条件。例如,你是一名电影视觉特效... 阅读全文

    优惠 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力

  • 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力
    AI
  • 韩国科学院推出新型大型语言和视觉模型Phantom,它旨在通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力。例如,你是一名教师,需要向学生解释一个复杂的科学概念,你可以上传一个相关的图表并给出描述,Phantom能够生成一个详细的图像,帮助学生更好地理解这个概念。或者,如果你是一... 阅读全文

    优惠 RACER:让机器人在进行物体操控任务时更加健壮和能够自我纠错

  • RACER:让机器人在进行物体操控任务时更加健壮和能够自我纠错
    AI
  • 密歇根大学计算机科学与工程系和密歇根大学机器人系的研究人员推出RACER,让机器人在进行物体操控任务时更加健壮和能够自我纠错。我们可以把机器人想象成一个刚开始学做家务的孩子,孩子在尝试把饼干放到架子上时可能会犯错,比如抓错了物体或者没有抓稳。这篇论文提出的方法就像是给孩子一个指导手册,告诉它在犯错后如何纠正自己,并且能... 阅读全文

    优惠 赜深科技推出新技术V3:能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染

  • 赜深科技推出新技术V3:能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染
    AI
  • 赜深科技、上海科技大学和鲁汶天主教大学的研究人员推出新技术V3,它能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染。简单来说,V3技术使用一种称为2D动态高斯(2D Dynamic Gaussians)的方法,将复杂的三维视频数据压缩成可以在移动设备上流畅播放的二维视频流。 项目主页:https://au... 阅读全文

    优惠 V-AURA:根据视频生成与之匹配的音频

  • V-AURA:根据视频生成与之匹配的音频
    AI
  • 坦佩雷大学和牛津大学的研究人员推出V-AURA模型,它用于根据视频生成与之匹配的音频。简单来说,V-AURA能够观察一段视频,并生成与之对应的、听起来很自然的音频。比如,如果视频显示一个人在弹吉他,V-AURA可以生成吉他声音的音频。 项目主页:https://v-aura.notion.site GitHub:htt... 阅读全文

    优惠 NASA推出新型人工智能模型Prithvi WxC:为了天气预报和气候研究而设计

  • NASA推出新型人工智能模型Prithvi WxC:为了天气预报和气候研究而设计
    AI
  • NASA推出新型人工智能模型Prithvi WxC,它是为了天气预报和气候研究而设计的。Prithvi WxC是一个大型的、多用途的模型,可以理解和预测天气模式。Prithvi WxC通过大量的数据训练,学习了天气变化的复杂模式,使其能够进行高质量的预测。这个模型的出现可能会改变我们进行天气预报和气候研究的方式。 Gi... 阅读全文

    优惠 音乐编解码器MuCodec:能够在极低的比特率下压缩和重建音乐

  • 音乐编解码器MuCodec:能够在极低的比特率下压缩和重建音乐
    AI
  • 清华大学深圳国际研究生院、腾讯人工智能实验室和香港中文大学的研究人员推出一个非常高效的音乐编解码器MuCodec,能够在极低的比特率下压缩和重建音乐。编解码器是一类软件,能够将音乐文件压缩成更小的体积进行存储或传输,同时保证在解压后尽可能保持音质。 项目主页:https://xuyaoxun.github.io/MuC... 阅读全文