加州大学圣地亚哥分校、Hillbot 、 浙江大学和加州大学洛杉矶分校的研究人员推出新技术SpaRP(Sparse-view Reconstruction and Pose estimation),它能够从稀疏视角的二维图像中快速重建出三维物体,并估计它们的相对姿态。这项技术对于现实世界中的许多应用来说都非常关键,比如在增强现实、虚拟现实、机器人视觉等领域。例如,你在网上购物时,只能看到一张产品图片,SpaRP技术可以帮助生成产品的三维视图,让你从不同角度查看产品,就像在实体店里一样。或者在游戏设计中,SpaRP可以快速为游戏角色或物体生成三维模型,提高游戏设计的效率和真实感。
- 项目主页:https://chaoxu.xyz/sparp
- Demo:https://huggingface.co/spaces/sudo-ai/SpaRP
主要功能:
- 三维重建:SpaRP可以从少量未定位的二维图像中重建出三维纹理网格模型。
- 姿态估计:它还能估计这些图像的相对相机姿态,这对于理解物体在空间中的定位非常重要。
主要特点:
- 快速高效:SpaRP能够在大约20秒内完成输入图像的三维重建和姿态估计。
- 开放世界通用性:它不依赖于特定类别的物体,能够处理各种不同的物体。
- 无需精确相机数据:在许多实际场景中,获取精确的相机数据并不总是可行的,SpaRP能够在只有少量图像和几乎没有重叠的情况下工作。
工作原理:
- 图像输入:SpaRP接受一个或多个未定位的二维图像作为输入。
- 知识蒸馏:它利用从二维扩散模型中提取的知识,并对其进行微调,以隐式推断稀疏视图之间的三维空间关系。
- 联合预测:SpaRP训练扩散模型来联合预测相机姿态的替代表示和在已知姿态下的多视图图像。
- 三维重建模块:使用预测的信息,SpaRP通过预训练的三维重建模块来创建纹理化的三维网格。
- 姿态细化:通过可微分渲染技术,SpaRP可以进一步细化估计的相机姿态,以提高精度。
具体应用场景:
- 电子商务:在电子商务网站上,用户可以上传产品的稀疏图片,SpaRP能够快速生成产品的三维模型,帮助用户更直观地了解产品。
- 消费者捕捉:消费者可以使用手机拍摄物体的几张照片,SpaRP能够从这些图片中重建出物体的三维形状,用于个性化定制或虚拟展示。
- 机器人导航:在机器人导航和交互中,SpaRP可以帮助机器人更好地理解周围环境的三维结构。
0条评论