当前位置：首页 > 优惠 >3D>文章详情

文生3D模型Dreamer XL：将文本转换为高分辨率的3D模型

推荐人：暴走AI| 商城: AI | 10个月前 (05-22)| 分类：3D | 热度：183 ℃

已关闭评论

来自英国杜伦大学、英国纽卡斯尔大学、中国地质大学的研究人员推出Dreamer XL，它用于将文本转换为高分辨率的3D模型。这项技术的目标是通过改进现有的文本到3D生成过程，生成更加逼真和详细的3D内容。例如，你想要创建一个虚拟现实游戏的环境，或者需要在建筑演示中展示一个新设计的建筑物。使用Dreamer XL，你只需提供描述性的文本，比如“一个中世纪风格的城堡，高耸在山巅，周围环绕着茂密的森林”，Dreamer XL就能够生成一个高分辨率、细节丰富的3D模型，直接用于你的项目中。

主要功能和特点：

高分辨率输出：Dreamer XL能够生成高达1024x1024分辨率的3D模型，这比现有的方法有显著提升。
轨迹得分匹配（TSM）：提出了一种新的优化方法，TSM通过生成两条路径来减少累积误差，从而提高模型生成路径的稳定性和一致性。
改进的梯度剪辑方法：为了解决在使用高分辨率稳定扩散模型（Stable Diffusion XL）时出现的梯度不稳定问题，提出了逐像素的梯度剪辑方法。
简化的训练过程：Dreamer XL避免了多阶段训练的需要，直接使用支持高分辨率的Stable Diffusion XL作为指导，简化了训练过程。

工作原理：

文本到图像的扩散模型：使用预训练的文本到图像扩散模型作为图像先验，通过神经参数化的3D模型（如NeRF或3D高斯分割）进行训练。
轨迹得分匹配（TSM）：TSM利用DDIM（去噪扩散隐式模型）的反演过程，从同一起点生成两条路径来进行计算，这样可以减少累积误差，从而减少伪地面真实一致性问题。
梯度剪辑：在3D高斯分割过程中，由于Stable Diffusion XL引入的梯度不稳定，会导致生成的3D模型失去复杂纹理细节，出现模糊和异常颜色。逐像素的梯度剪辑方法可以有效缓解这个问题。