Reenact Anything:实现一种语义视频运动转移的功能,可以让一张静态图片中的对象动起来,模仿另一个视频中的运动

分类:AI视频 | 热度:114 ℃

瑞士苏黎世联邦理工学院和迪士尼研究工作室的研究人员推出Reenact Anything,它能够实现一种语义视频运动转移的功能。简单来说,这项技术可以让一张静态图片中的对象动起来,模仿另一个视频中的运动。这不是简单的模仿动作,而是在保持原有图片外观和布局的同时,让图片中的对象按照视频里的动作进行“表演”。

例如,你有一张动物园里拍的照片,照片里有一只静止的大象。现在,你想让它动起来,就像你在视频里看到的那样,比如模仿一只跳舞的熊。使用“Reenact Anything”技术,你可以将视频中熊的跳舞动作转移到大象身上,让大象在照片中“跳起舞来”。

主要功能:

  • 语义视频运动转移:将一个视频中的运动转移到另一张静态图片上。
  • 跨域运动应用:能够在不同的场景和对象之间转移运动,比如将人类的动作应用到动物身上。

主要特点:

  • 无需空间对齐:不需要调整视频和图片中对象的相对位置,技术会自动处理。
  • 多种运动类型支持:支持全身动作、面部动作、相机运动,甚至是手工制作的动作。
  • 通用性:不依赖于特定领域,可以应用于多种不同的任务和场景。

工作原理:

  1. 运动-文本嵌入:使用一个预训练的图像到视频的扩散模型,将参考视频中的运动编码到一个称为“运动-文本嵌入”的向量中。
  2. 优化嵌入:通过优化这个嵌入,使其能够捕捉视频中的运动特征。
  3. 跨注意力机制:利用模型中的跨注意力机制,将文本或图像嵌入的影响主要控制在运动上,而不是外观。

具体应用场景:

  • 影视制作:在电影或电视剧的后期制作中,对角色或物体的动作进行编辑和调整。
  • 虚拟现实:在虚拟现实环境中,根据用户的需求生成动态内容。
  • 游戏开发:为游戏中的非玩家角色(NPC)生成自然流畅的动作。
  • 艺术创作:艺术家可以使用这项技术来创作动态艺术作品,给静态画作添加动态元素。

总的来说,“Reenact Anything”是一项强大的技术,它通过理解和转移视频中的运动,为创造动态内容提供了新的可能性。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论