在今年的世界人工智能大会上,商汤科技推出了其最新研发的人物视频生成大模型——Vimi。这一创新技术能够通过一张风格各异的照片,生成与指定动作同步的人物视频,并且支持多种驱动方式,包括现有视频、动画、声音和文字等元素。
超越传统表情控制的局限
与传统的图片表情控制技术相比,Vimi不仅仅局限于头部的表情动作,它还能够精确控制人物在半身区域内的自然肢体变化,并自动匹配相应的头发、服饰和背景,使得生成的视频更加生动和逼真。
稳定的长时间视频生成
Vimi模型能够稳定生成长达一分钟的单镜头人物视频,且画面质量不会随着时间的推移而下降或失真。这一特性满足了娱乐互动等领域对于长时间稳定视频生成的需求。
面向C端用户的开放使用
Vimi将全面向C端用户开放,用户只需上传高清人物图片,便可自动创建数字分身和多种风格的写真视频。这意味着普通用户也能够轻松享受到高质量的视频生成服务。
增强的视频创作灵活性
由Vimi生成的视频人物不再是简单的五官运动,而是结合了手势、肢体、头发等元素,形成了更为完整和统一的人物动作。这为创作者提供了丰富的素材,使他们能够基于这些视频进行剪辑和再创作,极大地扩展了视频创作的可能性。
0条评论