华中科技大学、华为公司和上海交通大学人工智能研究院的研究人员推出新型框架GaussianDreamerPro,它能够将文本转换成高质量的3D高斯资产(3D Gaussian assets),这些资产可以用于游戏、电影、扩展现实(XR)等行业。GaussianDreamerPro的核心思想是将高斯(Gaussians)与合理的几何结构绑定,这种几何结构在整个生成过程中不断演化,从而提高生成的3D资产的细节和质量。GaussianDreamerPro的一些限制,比如在处理多对象组合时可能会遇到的问题,以及未来可能的改进方向。
- 项目主页:https://taoranyi.com/gaussiandreamerpro
- GitHub:https://github.com/hustvl/GaussianDreamerPro
例如,一个游戏开发者想要创建一个科幻风格的游戏场景,他们可以输入文本描述,如“特斯拉士兵射击闪电,周围环绕着闪电,科幻,游戏”,GaussianDreamerPro能够根据这个描述生成一个3D模型,其中包括特斯拉士兵和环绕的闪电效果。这个模型可以直接用于游戏开发,或者进一步细化和动画化。
主要功能:
- 文本到3D资产的生成:用户可以输入文本描述,GaussianDreamerPro能够据此生成3D模型。
- 质量增强:相比之前的技术,GaussianDreamerPro能够生成细节更加丰富、质量更高的3D资产。
主要特点:
- 几何约束:通过将3D高斯与网格(mesh)绑定,控制高斯的增长,使其在可控范围内变化。
- 渐进式丰富:在不同的生成阶段,同时丰富几何结构和外观,以提高最终输出资产的质量。
- 下游应用的兼容性:生成的资产可以无缝集成到动画、合成和模拟等下游操作流程中。
工作原理:
- 基础3D资产生成:使用3D扩散模型生成初始的3D资产,这些资产具有非常粗糙的几何形状和外观。
- 2D高斯优化:将初始资产转换成2D高斯,通过2D扩散模型进行优化,以更好地对齐表面并提高基本3D资产的质量和几何形状。
- 网格绑定:从2D高斯导出带有彩色顶点的网格结构,初始化一系列3D高斯,并将其绑定到网格上。
- 细节增强优化:通过优化与几何结构绑定的3D高斯,最终得到细节高度增强的资产。
具体应用场景:
- 游戏开发:快速生成游戏内所需的3D模型和环境。
- 电影制作:创建电影中的3D场景和道具。
- XR体验:为虚拟现实(VR)和增强现实(AR)体验提供逼真的3D内容。
- 动画和模拟:生成的3D资产可以用于动画制作和物理模拟。
0条评论