火山引擎正式发布了两款AI视频生成大模型——豆包视频生成-PixelDance和豆包视频生成-Seaweed,面向企业市场开启邀请测试。这标志着字节跳动正式宣告进军AI视频生成领域。
豆包视频生成大模型特点:
- 高效融合计算单元:支持DiT融合计算单元,实现视频与文本的高效压缩编码。
- 全新扩散模型训练方法:采用全新设计的扩散模型训练方法,提升视频生成的泛化能力。
- 深度优化的Transformer结构:深度优化的Transformer结构,支持多风格多比例的一致性多镜头生成。
应用场景:
- 电商营销:为产品展示提供丰富的视觉内容。
- 动画教育:创造教育动画,提高学习体验。
- 城市文旅:用于城市宣传和文化旅游推广。
- 微剧本:为短视频和剧本创作提供支持。
性能表现:
火山引擎总裁谭待表示,豆包视频生成大模型在语义理解、多主体运动交互、多镜头内容一致性等方面达到业界先进水平。此外,模型支持多风格多比例的一致性多镜头生成,满足不同场景的需求。
用户增长:
自发布以来,豆包大模型的使用量呈现爆发式增长。截至9月,豆包语言模型的日均Token使用量超过1.3万亿,相比5月首次发布时增长了十倍。
技术突破:
豆包视频生成模型基于DiT架构,具备变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,同时具备专业级光影布局和色彩调和,使生成的视频极具美感和真实感。
火山引擎表示,豆包视频生成模型不仅适用于企业场景,也能为专业创作者和艺术家们提供创作辅助,加速拓展AI视频的创作空间和应用落地。
0条评论