MagicMan:用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作

分类:3D | 热度:124 ℃

清华大学深圳国际研究生院、腾讯人工智能实验室、香港科技大学、斯坦福大学和香港中文大学的研究人员推出MagicMan,它是一种用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作。MagicMan通过使用一个预训练的2D扩散模型和3D人体模型(SMPL-X)来生成高质量、多视角的人类图像,这些图像非常适合用于多视角重建等下游应用。例如,你是一名游戏设计师,需要为一个角色设计不同角度的图像。使用MagicMan,你只需提供一张角色的正面图像,模型就能生成该角色在不同视角下的图像,包括侧面、背面等,用于创建角色的3D模型或动画。

  • 项目主页:https://thuhcsi.github.io/MagicMan
  • GitHub:https://github.com/thuhcsi/MagicMan

主要功能:

  • 新视角图像生成:从单张参考图像生成多角度的人类图像。
  • 3D人体重建:利用生成的多视角图像来重建3D人体模型。

主要特点:

  • 3D意识:模型能够理解和生成符合3D空间结构的人类图像。
  • 迭代细化:通过迭代过程优化SMPL-X模型的准确性,提高生成图像的质量和一致性。
  • 混合多视角注意力机制:结合了1D和3D注意力机制,以提高不同视角间信息的交换效率。

工作原理:

  1. 条件扩散模型:使用预训练的2D扩散模型作为生成先验,SMPL-X模型作为3D身体先验。
  2. 混合多视角注意力:通过1D注意力在所有视角间建立连接,3D注意力在选定的视角子集上增强信息交换。
  3. 几何感知双分支:同时在RGB和法线图域进行生成,利用几何线索增强多视角一致性。
  4. 迭代细化策略:逐步优化SMPL-X参数的准确性,同时提升生成多视角图像的质量和一致性。

具体应用场景:

  • 游戏和电影制作:在游戏和电影中创建逼真的3D角色和动画。
  • 虚拟现实和增强现实:生成适合VR和AR应用的多视角人类图像。
  • 3D建模和设计:从单张照片快速创建3D模型,用于服装设计或室内设计。

总结来说,MagicMan是一个强大的工具,它通过结合2D和3D信息来生成逼真的多视角人类图像,这些图像可以直接用于3D重建或其他需要多视角内容的应用中。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论