优惠 多模态大语言模型基准评测MME-RealWorld:现实世界高分辨率场景下的性能评估
标签:MME-RealWorld
AI
2年前 (2024-08-26)AI
中科院人工智能研究所、南京大学、香港科技大学、南洋理工大学、中科院大学、松鼠AI和Meta AI的研究人员推出多模态大语言模型基准MME-RealWorld,在现实世界高分辨率场景下的性能评估。简单来说,就是研究当这些智能 ...... 阅读全文
优惠 从单一文本提示生成全视角可探索全景三维场景的新型框架LayerPano3D
标签:LayerPano3D
AI
2年前 (2024-08-26)AI
上海交通大学、香港中文大学、浙江大学、上海人工智能实验室、斯坦福大学和南洋理工大学的研究人员推出LayerPano3D,这是一种从单一文本提示生成全视角可探索全景三维场景的新型框架。我们的核心见解是将参考二维全 ...... 阅读全文
优惠 构建和深入理解视觉-语言模型!Hugging Face推出理解视觉-语言模型Idefics3-8B
2年前 (2024-08-26)AI
Hugging Face发布论文,论文的主题是关于构建和深入理解视觉-语言模型(VLMs)。VLMs是一种人工智能模型,它们能够处理和理解图像和文本,然后将这些信息综合起来输出文本。简单来说,这些模型就像一个能够“看”图片 ...... 阅读全文
优惠 喜加一 Steam平台限时免费领取横向动作射击游戏《Weapon of Choice DX》 0元
2年前 (2024-08-24)Steam
独立游戏工作室 Mommy's Best Games 开发的横向动作射击游戏《Weapon of Choice DX》现正于 Steam 平台展开限时免费活动。只需登录 Steam 前往游戏的商店页面领取,即可将其永久保存至您的游戏库中。本次限免活动将 ...... 阅读全文
优惠 新型人工智能代理Anim-Director:一个强大的多模态大型模型驱动的动画视频生成器
标签:Anim-Director
AI
2年前 (2024-08-23)AI
哈尔滨工业大学(深圳)推出新型人工智能代理Anim-Director,它是一个强大的多模态大型模型(LMMs)驱动的动画视频生成器。简单来说,Anim-Director就像一个虚拟的动画导演,能够根据简短的叙述或指令,自动创作出连 ...... 阅读全文
优惠 视频到声音的转换系统Video-Foley:专门用于生成与视频内容在时间和语义上同步的声音效果
标签:Video-Foley
AI
2年前 (2024-08-23)AI
韩国科学技术院MAC实验室推出Video-Foley系统,它是一个视频到声音的转换系统,专门用于生成与视频内容在时间和语义上同步的声音效果(Foley声)。例如,你在观看一部电影,看到一个人用木棍敲打不同材料,比如木头 ...... 阅读全文













