AI
优惠 全新基准测试工具T2V-CompBench:用于评估文本到视频(Text-to-Video, T2V)生成模型的性能
标签:T2V-CompBench
AI
5个月前 (07-24)AI
香港大学、香港中文大学和华为诺亚方舟实验室的研究人员推出全新基准测试工具T2V-CompBench,它专门用于评估文本到视频(Text-to-Video, T2V)生成模型的性能。T2V模型需要根据这个描述生成一段视频。但T2V-CompBench不仅测试模型能否生成视频,更重要的是测试它是否能够准确地组合多个对象、属... 阅读全文
优惠 多模态大语言模型评估框架MultiTrust
标签:MultiTrust
AI
5个月前 (07-22)AI
清华大学、北京航空航天大学、上海交通大学和RealAI的研究人员推出多模态大语言模型评估框架MultiTrust。简单来说,就是研究这些能够同时处理文本和图像等多种形式信息的人工智能模型是否值得信赖。这包括了它们在面对各种任务时的准确性、安全性、鲁棒性、公平性和隐私保护能力。 项目主页:https://multi-tr... 阅读全文
优惠 Streetscapes:通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图
5个月前 (07-22)AI
Google 研究和斯坦福大学的研究人员推出Streetscapes,即通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图。这项技术可以用于从单一视频生成动态场景的三维重建和新视角合成。简单来说,就是利用几张街景图片和一些文本描述,计算机能够自动生成一段连续的、逼真的城市街道视频,展示出街道随着时间和天... 阅读全文
优惠 Shape of Motion:从单一视频重建动态场景的四维(4D)结构
5个月前 (07-22)AI
加州大学伯克利分校和 Google 研究的研究人员推出Shape of Motion,从单一视频重建动态场景的四维(4D)结构。这项技术旨在从一段普通的单眼(即从一个视角)视频中恢复出场景的三维(3D)几何结构和随时间变化的运动轨迹。简单来说,就是让计算机能够从一段视频中理解物体的形状和它们是如何移动的。 项目主页:h... 阅读全文
优惠 3D重建技术SparseCraft:从少量彩色图像中恢复出3D形状和视角依赖的外观,实现高效的3D重建和新视角合成
标签:SparseCraft
AI
5个月前 (07-22)AI
来自法国的团队推出一种新颖的3D重建技术,名为SparseCraft。这项技术能够从少量彩色图像中恢复出3D形状和视角依赖的外观,实现高效的3D重建和新视角合成。简单来说,就是通过几张图片来构建一个物体的三维模型,并能在不同视角下生成逼真的图像。例如,你是一名建筑师,需要将一个古老的建筑转换成3D模型以进行翻新设计。使... 阅读全文
优惠 PlacidDreamer:用于将文本转换成3D模型的先进框架
标签:PlacidDreamer
AI
5个月前 (07-22)AI
清华大学和快手的研究人员推出PlacidDreamer,这是一个用于将文本转换成3D模型的先进框架。想象一下,如果你能通过简单的文字描述,比如“一个红色的苹果”,然后计算机就能生成一个3D的苹果模型,这听起来是不是很酷?这就是PlacidDreamer所做的工作。例如,你是一个游戏设计师,你需要设计一个“中世纪城堡”的... 阅读全文