当前位置：首页 > 优惠 >3D>文章详情

PlacidDreamer：用于将文本转换成3D模型的先进框架

推荐人：暴走AI| 商城: AI | 2年前 (2024-07-22)| 分类：3D | 热度：936 ℃

已关闭评论

清华大学和快手的研究人员推出PlacidDreamer，这是一个用于将文本转换成3D模型的先进框架。想象一下，如果你能通过简单的文字描述，比如“一个红色的苹果”，然后计算机就能生成一个3D的苹果模型，这听起来是不是很酷？这就是PlacidDreamer所做的工作。例如，你是一个游戏设计师，你需要设计一个“中世纪城堡”的场景。你可以用PlacidDreamer输入描述如“一座古老的石头城堡，周围环绕着茂密的森林”，系统就会生成一个3D的城堡模型，并且城堡的每一面都符合中世纪的建筑风格，森林的细节也非常丰富，看起来就像真的一样。

GitHub：https://github.com/HansenHuang0823/PlacidDreamer

PlacidDreamer：用于将文本转换成3D模型的先进框架

主要功能和特点：

文本到3D生成：PlacidDreamer可以将文本描述直接转换成3D模型，这在游戏设计、电影特效制作和虚拟现实等领域非常有用。
多视图一致性：通过多视图扩散模型，确保从不同角度观察生成的3D模型时，其外观保持一致。
细节丰富：使用新颖的得分蒸馏算法，使得生成的3D模型不仅在形状上准确，而且在颜色和纹理上也更加丰富和真实。
平衡饱和度：解决了以往方法中颜色过于饱和的问题，使得生成的3D模型颜色更加自然。

工作原理：

初始化：首先使用预训练的2D模型生成一个参考图像，比如通过文本描述生成一个苹果的2D图像。
多视图生成：然后，利用多视图扩散模型从不同角度生成苹果的多视图图像。
Latent-Plane模块：这是一个关键的创新点，它通过训练友好的方式增强多视图扩散模型，使其能够快速重建几何结构，并生成更准确的多视图图像。
得分蒸馏：通过一个新的得分蒸馏算法（Balanced Score Distillation，BSD），将2D图像的细节和颜色信息转移到3D模型上，同时控制颜色的饱和度，避免过饱和。