当前位置：首页 > 优惠 >AI视频>文章详情

新型文本到视频生成基准测试ChronoMagic-Bench

推荐人：暴走AI| 商城: AI | 10个月前 (06-29)| 分类：AI视频 | 热度：295 ℃

已关闭评论

新型文本到视频（Text-to-Video, T2V）生成基准测试ChronoMagic-Bench。这个基准测试专门用来评估T2V模型在生成具有显著变化幅度和时间连贯性的延时视频方面的能力。简单来说，ChronoMagic-Bench就像是一个考试，它用来测试视频生成模型是否能够根据文本描述，制作出既符合描述又在视觉上流畅、连贯的延时视频。

GitHub：https://github.com/PKU-YuanGroup/ChronoMagic-Bench
Demo：https://huggingface.co/spaces/BestWishYsh/ChronoMagic-Bench

例如，你想要生成一个描述“一朵花从含苞待放到完全盛开”的延时视频，使用ChronoMagic-Bench，你可以评估不同的T2V模型是否能够根据这个文本描述生成一个视觉上连贯、变化幅度大的视频。通过MTScore和CHScore，你可以量化这个视频在变形和时间连贯性上的表现，从而选择最佳的模型来制作你的视频。

主要功能和特点：

多样化的评估指标：ChronoMagic-Bench不仅关注视频的视觉质量和文本相关性，还特别强调视频的变形幅度（即视频中物体或场景随时间变化的程度）和时间连贯性（视频内容在时间线上是否逻辑连贯）。
创新的自动评估指标：论文提出了两个新的自动评估指标，MTScore（变形幅度评分）和CHScore（时间连贯性评分），以更准确地反映人类对视频的评价。
大规模的高质量数据集：ChronoMagic-Pro数据集包含460k对720p高清延时视频和详细的字幕，这些视频涵盖了丰富的物理变化，如冰融化、花朵开放等。