AI

优惠 新型3D框架DreamWaltz-G:根据文本描述生成具有表现力的3D高斯化身(即3D头像),并且这些头像可以进行动画化处理

  • 新型3D框架DreamWaltz-G:根据文本描述生成具有表现力的3D高斯化身(即3D头像),并且这些头像可以进行动画化处理
    AI
  • 香港大学、星尘智能、腾讯、中国科学技术大学和国际数字经济学院(IDEA)的研究人员推出新型框架DreamWaltz-G,它能够根据文本描述生成具有表现力的3D高斯化身(即3D头像),并且这些头像可以进行动画化处理。简单来 ...... 阅读全文

    优惠 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务

  • 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务
    AI
  • 越南FPT软件AI中心推出新型通用软件工程代理系统HyperAgent,这个系统能够自动执行多种编程任务,比如修复软件中的错误、添加新功能、改进代码质量等。与现有的基于LLM的软件代理不同,后者通常专注于特定任务,Hype ...... 阅读全文

    优惠 HuggingChat推出macOS客户端,将高级AI对话的能力直接带到您的桌面

  • HuggingChat推出macOS客户端,将高级AI对话的能力直接带到您的桌面
    AI
  • HuggingChat macOS 是一个专为 macOS 用户设计的原生聊天界面,它利用开源语言模型的强大功能。这款应用将高级AI对话的能力直接带到您的桌面,提供一个无缝且直观的体验。 为什么选择 HuggingChat macOS? 原生体验: ...... 阅读全文

    优惠 avsoundscape:能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的

  • avsoundscape:能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的
    AI
  • 加州大学伯克利分校、Meta和密歇根大学的研究人员推出Self-Supervised Audio-Visual Soundscape Stylization技术,它能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的。简单来说,就是可以通 ...... 阅读全文

    优惠 谷歌推出零样本跨语言声音转换技术Zero-shot Cross-lingual Voice Transfer

  • 谷歌推出零样本跨语言声音转换技术Zero-shot Cross-lingual Voice Transfer
    AI
  • 谷歌推出了一种名为“Zero-shot Cross-lingual Voice Transfer”(零样本跨语言声音转换)的技术,它可以将一个人的语音转换到另一种语言中去。简单来说,就是如果你有一种语言的语音样本,这项技术能够让你的声音听起 ...... 阅读全文

    优惠 微软研究院推出SpaceBlender系统:利用生成式AI来创造VR环境中的3D空间的工具

  • 微软研究院推出SpaceBlender系统:利用生成式AI来创造VR环境中的3D空间的工具
    AI
  • 微软研究院推出SpaceBlender系统,它是一个利用生成式人工智能(AI)来创造虚拟现实(VR)环境中的3D空间的工具。简单来说,SpaceBlender可以把用户周围的真实环境转换成3D虚拟环境,让用户在VR中体验到融合了现实世 ...... 阅读全文

    优惠 英伟达推出MaskedMimic:用于控制虚拟角色动作的人工智能系统

  • 英伟达推出MaskedMimic:用于控制虚拟角色动作的人工智能系统
    AI
  • 英伟达推出MaskedMimic,它是一个用于控制虚拟角色动作的人工智能系统。想象一下,我们想要创造一个能够根据我们给定的条件做出各种动作的虚拟角色,比如在虚拟现实游戏中的人物或者电影里的动画角色。MaskedMimic就 ...... 阅读全文

    优惠 用于逆向渲染的技术MaterialFusion:能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照

  • 用于逆向渲染的技术MaterialFusion:能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照
    AI
  • 卡内基梅隆大学和特拉维夫大学的研究人员推出一个用于逆向渲染的技术MaterialFusion,能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照。简而言之,MaterialFusion能够从一个物体在不 ...... 阅读全文

    优惠 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力

  • 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力
    AI
  • 韩国科学院推出新型大型语言和视觉模型Phantom,它旨在通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力。例如,你是一名教师,需要向学生解释一个复杂的科学概念,你可 ...... 阅读全文

    优惠 RACER:让机器人在进行物体操控任务时更加健壮和能够自我纠错

  • RACER:让机器人在进行物体操控任务时更加健壮和能够自我纠错
    AI
  • 密歇根大学计算机科学与工程系和密歇根大学机器人系的研究人员推出RACER,让机器人在进行物体操控任务时更加健壮和能够自我纠错。我们可以把机器人想象成一个刚开始学做家务的孩子,孩子在尝试把饼干放到架子上时可 ...... 阅读全文

    优惠 赜深科技推出新技术V3:能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染

  • 赜深科技推出新技术V3:能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染
    AI
  • 赜深科技、上海科技大学和鲁汶天主教大学的研究人员推出新技术V3,它能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染。简单来说,V3技术使用一种称为2D动态高斯(2D Dynamic Gaussians)的方法,将 ...... 阅读全文

    优惠 V-AURA:根据视频生成与之匹配的音频

  • V-AURA:根据视频生成与之匹配的音频
    AI
  • 坦佩雷大学和牛津大学的研究人员推出V-AURA模型,它用于根据视频生成与之匹配的音频。简单来说,V-AURA能够观察一段视频,并生成与之对应的、听起来很自然的音频。比如,如果视频显示一个人在弹吉他,V-AURA可以生成 ...... 阅读全文