人工智能
优惠 多模态大语言模型评估框架MultiTrust
标签:MultiTrust
AI
8个月前 (07-22)AI
清华大学、北京航空航天大学、上海交通大学和RealAI的研究人员推出多模态大语言模型评估框架MultiTrust。简单来说,就是研究这些能够同时处理文本和图像等多种形式信息的人工智能模型是否值得信赖。这包括了它们在面对各种任务时的准确性、安全性、鲁棒性、公平性和隐私保护能力。 项目主页:https://multi-tr... 阅读全文
优惠 Streetscapes:通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图
8个月前 (07-22)AI
Google 研究和斯坦福大学的研究人员推出Streetscapes,即通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图。这项技术可以用于从单一视频生成动态场景的三维重建和新视角合成。简单来说,就是利用几张街景图片和一些文本描述,计算机能够自动生成一段连续的、逼真的城市街道视频,展示出街道随着时间和天... 阅读全文
优惠 Shape of Motion:从单一视频重建动态场景的四维(4D)结构
8个月前 (07-22)AI
加州大学伯克利分校和 Google 研究的研究人员推出Shape of Motion,从单一视频重建动态场景的四维(4D)结构。这项技术旨在从一段普通的单眼(即从一个视角)视频中恢复出场景的三维(3D)几何结构和随时间变化的运动轨迹。简单来说,就是让计算机能够从一段视频中理解物体的形状和它们是如何移动的。 项目主页:h... 阅读全文
优惠 3D重建技术SparseCraft:从少量彩色图像中恢复出3D形状和视角依赖的外观,实现高效的3D重建和新视角合成
标签:SparseCraft
AI
8个月前 (07-22)AI
来自法国的团队推出一种新颖的3D重建技术,名为SparseCraft。这项技术能够从少量彩色图像中恢复出3D形状和视角依赖的外观,实现高效的3D重建和新视角合成。简单来说,就是通过几张图片来构建一个物体的三维模型,并能在不同视角下生成逼真的图像。例如,你是一名建筑师,需要将一个古老的建筑转换成3D模型以进行翻新设计。使... 阅读全文
优惠 PlacidDreamer:用于将文本转换成3D模型的先进框架
标签:PlacidDreamer
AI
8个月前 (07-22)AI
清华大学和快手的研究人员推出PlacidDreamer,这是一个用于将文本转换成3D模型的先进框架。想象一下,如果你能通过简单的文字描述,比如“一个红色的苹果”,然后计算机就能生成一个3D的苹果模型,这听起来是不是很酷?这就是PlacidDreamer所做的工作。例如,你是一个游戏设计师,你需要设计一个“中世纪城堡”的... 阅读全文
优惠 谷歌推出新型稀疏自编码器JumpReLU SAEs:用于提高语言模型激活的重建保真度
8个月前 (07-22)AI
谷歌推出新型稀疏自编码器(Sparse Autoencoders, SAEs),称为JumpReLU SAEs,它用于提高语言模型(Language Model, LM)激活的重建保真度。简单来说,这种技术可以帮助我们从大量文本数据中提取出关键信息,并且以一种非常节省资源的方式表示这些信息。论文还提到了一些限制和未来的... 阅读全文