当前位置：首页 > 优惠 >3D>文章详情

HoloDreamer：从文本描述生成全包围3D全景世界的系统

推荐人：暴走AI| 商城: AI | 9个月前 (07-24)| 分类：3D | 热度：233 ℃

已关闭评论

北京大学和鹏城实验室的研究人员推出HoloDreamer，它是一个从文本描述生成全包围3D全景世界的系统。简单来说，HoloDreamer可以读懂你用文字描述的场景，然后创造出一个360度全方位的3D场景。这就像是用文字给一个画家描述你心中的梦想家园，然后画家不仅画出了家园的正面，还画出了周围和内部的所有视角。

项目主页：https://zhouhyocean.github.io/holodreamer
GitHub：https://github.com/zhouhyOcean/HoloDreamer

主要功能：

文本到3D场景的转换：用户输入文本描述，HoloDreamer生成对应的3D全景图。
高视觉一致性：生成的3D场景在各个视角下都能保持一致性和完整性。
细节丰富：不仅生成场景的大体结构，还能细化到小的装饰和纹理。

主要特点：

全景生成：直接生成一个完整的360度全景图，而不是通过逐步扩展局部图像来构建场景。
风格化细节：结合多个扩散模型，能够根据文本描述生成具有特定风格和丰富细节的全景图。
3D重建：使用3D高斯Splatting技术快速重建3D场景，提高重建质量和渲染的鲁棒性。

工作原理：

风格化全景生成：首先使用扩散模型根据文本描述生成基础全景图，然后通过风格迁移和细节增强技术，生成具有高分辨率和视觉风格的全景图。
两阶段全景重建：在生成全景图后，利用单目深度估计模型进行深度估计，将RGBD数据转换为点云，并用点云初始化3D高斯。然后通过两阶段的优化过程，先进行多视角约束的预优化，再通过图像修复模型填充缺失区域，最后进行传输优化，以增强场景的完整性。