3D

优惠 FiT3D:一种提升2D图像特征表示的方法,特别强调了通过3D意识的微调来增强这些特征

  • FiT3D:一种提升2D图像特征表示的方法,特别强调了通过3D意识的微调来增强这些特征
    AI
  • 苏黎世联邦理工学院、马克斯普朗克信息学研究所和谷歌的研究人员推出一种提升2D图像特征表示的方法,特别强调了通过3D意识的微调(3D-aware fine-tuning)来增强这些特征。这种方法的核心思想是,通过在3D空间中对2D图像特征进行处理,可以让模型更好地理解和表达物体和场景的结构,从而提高在各种下游任务中的表现... 阅读全文

    优惠 物体与地面重建模型ORG:能够从单目图像中同时重建3D物体、估计相机参数,并模拟物体与地面的关系

  • 物体与地面重建模型ORG:能够从单目图像中同时重建3D物体、估计相机参数,并模拟物体与地面的关系
    AI
  • 伊利诺伊大学厄巴纳-香槟分校、普渡大学和Adob​​e的研究人员推出ORG(Object Reconstruction with Ground,物体与地面重建)的模型,它能够从单目图像中同时重建3D物体、估计相机参数,并模拟物体与地面的关系。这项技术为3D视觉和图像处理领域提供了一种新的工具,使得从单张图片中提取3D信... 阅读全文

    优惠 SHIC:用于在没有关键点标注的监督下学习图像与3D模板之间的对应关系

  • SHIC:用于在没有关键点标注的监督下学习图像与3D模板之间的对应关系
    AI
  • 牛津大学视觉几何组的研究人员推出新技术SHIC,用于在没有关键点标注的监督下学习图像与3D模板之间的对应关系。简单来说,这项技术可以自动识别图片中物体的每个像素点,并将其与3D模型中的相应点对应起来,而不需要人工去标记这些对应点。这项技术为自动理解图像内容、3D建模和动画制作等领域提供了强大的工具,使得从图像中自动提取... 阅读全文

    优惠 WalkTheDog:理解和对齐不同形态(如人和狗)的运动数据集

  • WalkTheDog:理解和对齐不同形态(如人和狗)的运动数据集
    AI
  • 苏黎世联邦理工学院和Meta Reality Labs的研究人员推出WalkTheDog,这种新方法来理解和对齐不同形态(如人和狗)的运动数据集。这个方法的核心是“相位流形(Phase Manifolds)”,它能够将具有不同骨骼结构的角色的运动数据映射到一个共享的空间中,而不需要任何监督信号或骨骼结构的对应关系。这项... 阅读全文

    优惠 三维多模态问题回答技术City-3DQA:用于城市场景理解。这项技术能够帮助智能代理(如自动驾驶汽车、智能助手等)更好地理解它们所处的三维环境

  • 三维多模态问题回答技术City-3DQA:用于城市场景理解。这项技术能够帮助智能代理(如自动驾驶汽车、智能助手等)更好地理解它们所处的三维环境
    AI
  • 香港科技大学(广州)、浙江大学、广州大学、哈尔滨工业大学的研究人员推出一种新型的三维多模态问题回答(3D MQA)技术,用于城市场景理解。这项技术能够帮助智能代理(如自动驾驶汽车、智能助手等)更好地理解它们所处的三维环境,特别是城市级别的场景。论文还提到了他们的方法在不同设置下达到了63.94%和63.76%的准确率,... 阅读全文

    优惠 3D生成框架Cycle3D:将2D图片转换成高质量的3D模型,这个转换过程既保持了图像的纹理细节,又确保了3D模型的多视角一致性

  • 3D生成框架Cycle3D:将2D图片转换成高质量的3D模型,这个转换过程既保持了图像的纹理细节,又确保了3D模型的多视角一致性
    AI
  • 北京大学、鹏程实验室和新加坡国立大学的研究人员推出新型图像到3D生成框架Cycle3D,Cycle3D的目标是将2D图片转换成高质量的3D模型,这个转换过程既保持了图像的纹理细节,又确保了3D模型的多视角一致性。例如,你是一名游戏开发者,需要快速生成一个3D角色模型。使用Cycle3D,你可以上传一张角色的概念图,Cy... 阅读全文

    优惠 3D汽车重建技术DreamCar:它能够利用少量甚至单张汽车图片,重建出高质量的三维汽车模型

  • 3D汽车重建技术DreamCar:它能够利用少量甚至单张汽车图片,重建出高质量的三维汽车模型
    AI
  • DreamCar 是一项创新的3D汽车重建技术,它能够利用少量甚至单张汽车图片,重建出高质量的三维汽车模型。这对于自动驾驶行业的模拟器来说是一个巨大的突破,因为传统上,创建精致的3D汽车模型需要专业的艺术家手工制作,这既耗时又成本高昂。为了使生成模型更加通用,研究团队收集了一个包含超过5,600辆汽车的数据集,命名为C... 阅读全文

    优惠 为人工智能软件开发者设计的开源平台OpenDevin

  • 为人工智能软件开发者设计的开源平台OpenDevin
    AI
  • OpenDevin是一个开放平台,它是为人工智能软件开发者设计的,特别是那些希望构建能够像人类开发者一样与世界互动的通用人工智能代理。这些AI代理可以通过编写代码、与命令行交互以及浏览网络来实现复杂的任务。OpenDevin是一个开发强大且灵活的人工智能代理的平台,这些代理能像人类开发者一样通过编写代码、与命令行交互以... 阅读全文

    优惠 HoloDreamer:从文本描述生成全包围3D全景世界的系统

  • HoloDreamer:从文本描述生成全包围3D全景世界的系统
    AI
  • 北京大学 和鹏城实验室的研究人员推出HoloDreamer,它是一个从文本描述生成全包围3D全景世界的系统。简单来说,HoloDreamer可以读懂你用文字描述的场景,然后创造出一个360度全方位的3D场景。这就像是用文字给一个画家描述你心中的梦想家园,然后画家不仅画出了家园的正面,还画出了周围和内部的所有视角。 项目... 阅读全文

    优惠 新型图像渲染技术BoostMVSNeRFs:用来提升一种叫做“多视图立体(MVS)基础神经辐射场(NeRF)”的渲染质量,特别是在处理大规模场景时的通用视图合成能力

  • 新型图像渲染技术BoostMVSNeRFs:用来提升一种叫做“多视图立体(MVS)基础神经辐射场(NeRF)”的渲染质量,特别是在处理大规模场景时的通用视图合成能力
    AI
  • 阳明交通大学和台湾大学的研究人员推出一种新的图像渲染技术,名为“BoostMVSNeRFs”。这个技术是用来提升一种叫做“多视图立体(MVS)基础神经辐射场(NeRF)”的渲染质量,特别是在处理大规模场景时的通用视图合成能力。总的来说,BoostMVSNeRFs是一种先进的图像渲染技术,它通过智能地选择和组合多个视图的... 阅读全文

    优惠 三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述

  • 三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述
    AI
  • 北京通用人工智能研究院和 北京大学人工智能研究院的研究人员推出新模型F-HOI,它能够理解和生成与人类与物体交互相关的精细描述。主要是三维人体与物体交互(3D Human-Object Interaction, HOI)的精细语义对齐问题。想象一下,你有一个虚拟助手,能够观察一个人在视频中如何拿起一个瑜伽垫,然后不仅能... 阅读全文

    优惠 Streetscapes:通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图

  • Streetscapes:通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图
    AI
  • Google 研究和斯坦福大学的研究人员推出Streetscapes,即通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图。这项技术可以用于从单一视频生成动态场景的三维重建和新视角合成。简单来说,就是利用几张街景图片和一些文本描述,计算机能够自动生成一段连续的、逼真的城市街道视频,展示出街道随着时间和天... 阅读全文