3D

优惠 大规模合成数据集VGGHeads:专门用于3D人头检测、关键点估计和3D头部模型拟合等重要任务

  • 大规模合成数据集VGGHeads:专门用于3D人头检测、关键点估计和3D头部模型拟合等重要任务
    AI
  • 牛津大学的研究人员推出大规模合成数据集VGGHeads,它专门用于3D人头检测、关键点估计和3D头部模型拟合等重要任务。这些任务在面部识别、动画制作、增强现实和医学成像等领域有着广泛的应用。例如,我们需要训练一个计算机视觉系统来识别图片中的人脸,并准确地模拟出人头的三维形状。这通常需要大量的真实人脸图片和相应的三维模型... 阅读全文

    优惠 交互式视频生成模型Puppet-Master:作为一个运动先验来捕捉物体部分级别的动力学

  • 交互式视频生成模型Puppet-Master:作为一个运动先验来捕捉物体部分级别的动力学
    AI
  • 牛津大学的研究人员推出交互式视频生成模型Puppet-Master,它可以作为一个运动先验来捕捉物体部分级别的动力学。简单来说,Puppet-Master能够根据单个图像和一组稀疏的运动轨迹(即拖动操作),合成一段展示逼真物体部分运动的视频。这就像是有一个虚拟的木偶大师,通过几个简单的手势指令,就能够控制视频中物体各部... 阅读全文

    优惠 大规模数据集“SG3D”:为了推动三维场景中任务导向的顺序定位任务的研究而创建

  • 大规模数据集“SG3D”:为了推动三维场景中任务导向的顺序定位任务的研究而创建
    AI
  • 北京通用人工智能研究院 (BIGAI) 、清华大学和北京理工大学的研究人员推出大规模数据集“SG3D”(Sequential Grounding in 3D Scenes),它是为了推动三维场景中任务导向的顺序定位(task-oriented sequential grounding)任务的研究而创建的。这项任务涉及到... 阅读全文

    优惠 创新系统Sketch2Scene:根据用户的简单草图和文本提示,自动生成交互式的3D游戏场景

  • 创新系统Sketch2Scene:根据用户的简单草图和文本提示,自动生成交互式的3D游戏场景
    AI
  • 腾讯XR视觉实验室和澳大利亚国立大学的研究人员推出创新系统Sketch2Scene,它能够根据用户的简单草图和文本提示,自动生成交互式的3D游戏场景。这就像是给一个会魔法的画家,只需要随手画几笔和简单描述,就能创造出一个栩栩如生的游戏世界。例如,你想要创造一个游戏场景,但你可能不是专业的3D建模师。有了Sketch2S... 阅读全文

    优惠 新颖方法omages:用于生成逼真的3D模型和UV贴图,这个过程通过一种称为“对象图像”的表示来实现

  • 新颖方法omages:用于生成逼真的3D模型和UV贴图,这个过程通过一种称为“对象图像”的表示来实现
  • 西蒙菲莎大学和香港城市大学的研究人员推出新颖方法omages,用于生成逼真的3D模型和UV贴图,这个过程通过一种称为“对象图像”(Object Images)的表示来实现。简单来说,就是将复杂的3D形状转换成64x64像素的2D图像,这样做的好处是可以利用现有的图像生成模型,比如扩散变换器(Diffusion Tran... 阅读全文

    优惠 MeshAnything V2系统:能够自动生成与给定形状对齐的艺术家创造的网格的模型

  • MeshAnything V2系统:能够自动生成与给定形状对齐的艺术家创造的网格的模型
    AI
  • 洋理工大学、清华大学、伦敦帝国理工学院和西湖大学的研究人员推出MeshAnything V2系统,它是一个能够自动生成与给定形状对齐的艺术家创造的网格(Artist-Created Meshes,简称AM)的模型。简单来说,MeshAnything V2就像一个聪明的3D设计师,可以根据你提供的形状或者描述,自动设计出... 阅读全文

    优惠 TexGen:用于3D纹理生成的系统,能够根据文本描述自动创建出相应的3D纹理

  • TexGen:用于3D纹理生成的系统,能够根据文本描述自动创建出相应的3D纹理
    AI
  • 加拿大阿尔伯塔大学、加拿大多伦多大学和华为诺亚方舟实验室的研究人员推出新技术TexGen,它是一种用于3D纹理生成的系统,能够根据文本描述自动创建出相应的3D纹理。想象一下,如果你是一名游戏设计师或者电影特效师,想要给一个3D模型穿上“衣服”,但不想手动一点点去画,TexGen就能帮你实现这个愿望。 项目主页:http... 阅读全文

    优惠 FiT3D:一种提升2D图像特征表示的方法,特别强调了通过3D意识的微调来增强这些特征

  • FiT3D:一种提升2D图像特征表示的方法,特别强调了通过3D意识的微调来增强这些特征
    AI
  • 苏黎世联邦理工学院、马克斯普朗克信息学研究所和谷歌的研究人员推出一种提升2D图像特征表示的方法,特别强调了通过3D意识的微调(3D-aware fine-tuning)来增强这些特征。这种方法的核心思想是,通过在3D空间中对2D图像特征进行处理,可以让模型更好地理解和表达物体和场景的结构,从而提高在各种下游任务中的表现... 阅读全文

    优惠 物体与地面重建模型ORG:能够从单目图像中同时重建3D物体、估计相机参数,并模拟物体与地面的关系

  • 物体与地面重建模型ORG:能够从单目图像中同时重建3D物体、估计相机参数,并模拟物体与地面的关系
    AI
  • 伊利诺伊大学厄巴纳-香槟分校、普渡大学和Adob​​e的研究人员推出ORG(Object Reconstruction with Ground,物体与地面重建)的模型,它能够从单目图像中同时重建3D物体、估计相机参数,并模拟物体与地面的关系。这项技术为3D视觉和图像处理领域提供了一种新的工具,使得从单张图片中提取3D信... 阅读全文

    优惠 SHIC:用于在没有关键点标注的监督下学习图像与3D模板之间的对应关系

  • SHIC:用于在没有关键点标注的监督下学习图像与3D模板之间的对应关系
    AI
  • 牛津大学视觉几何组的研究人员推出新技术SHIC,用于在没有关键点标注的监督下学习图像与3D模板之间的对应关系。简单来说,这项技术可以自动识别图片中物体的每个像素点,并将其与3D模型中的相应点对应起来,而不需要人工去标记这些对应点。这项技术为自动理解图像内容、3D建模和动画制作等领域提供了强大的工具,使得从图像中自动提取... 阅读全文

    优惠 WalkTheDog:理解和对齐不同形态(如人和狗)的运动数据集

  • WalkTheDog:理解和对齐不同形态(如人和狗)的运动数据集
    AI
  • 苏黎世联邦理工学院和Meta Reality Labs的研究人员推出WalkTheDog,这种新方法来理解和对齐不同形态(如人和狗)的运动数据集。这个方法的核心是“相位流形(Phase Manifolds)”,它能够将具有不同骨骼结构的角色的运动数据映射到一个共享的空间中,而不需要任何监督信号或骨骼结构的对应关系。这项... 阅读全文

    优惠 三维多模态问题回答技术City-3DQA:用于城市场景理解。这项技术能够帮助智能代理(如自动驾驶汽车、智能助手等)更好地理解它们所处的三维环境

  • 三维多模态问题回答技术City-3DQA:用于城市场景理解。这项技术能够帮助智能代理(如自动驾驶汽车、智能助手等)更好地理解它们所处的三维环境
    AI
  • 香港科技大学(广州)、浙江大学、广州大学、哈尔滨工业大学的研究人员推出一种新型的三维多模态问题回答(3D MQA)技术,用于城市场景理解。这项技术能够帮助智能代理(如自动驾驶汽车、智能助手等)更好地理解它们所处的三维环境,特别是城市级别的场景。论文还提到了他们的方法在不同设置下达到了63.94%和63.76%的准确率,... 阅读全文