当前位置：首页 > 优惠 >AI绘画>文章详情

基准测试Visual Haystacks：模拟了现实世界的场景，要求模型不仅要找到包含答案的图片，还要利用视觉内容进行推理来回答具体问题

推荐人：暴走AI| 商城: AI | 11个月前 (07-24)| 分类：AI绘画 | 热度：246 ℃

已关闭评论

加州大学伯克利分校的研究人员发布论文，论文的主题是关于如何让计算机更好地回答关于多张图片集合的问题，这在现实世界中非常有用，比如在翻看大量照片、网上搜索特定信息，或者通过卫星图像监控环境变化时。我们可以把这个问题想象成在一堆干草中找到一根针，但更难，因为需要在很多堆干草中找到答案。

论文还提到了他们创建的Visual Haystacks（VHs）基准测试，它模拟了现实世界的场景，要求模型不仅要找到包含答案的图片，还要利用视觉内容进行推理来回答具体问题。例如，如果问题是“在所有包含猫的图片中，有狗吗？”模型需要能够识别出哪张图片里有猫，然后进一步判断那张图片里是否有狗。

MIRAGE框架通过减少每张图片所需的标记数量、使用检索模型来过滤掉不相关的图片，并结合额外的合成和真实MIQA数据来增强训练过程，从而提高了模型的性能。论文的实验结果表明，MIRAGE在VHs基准测试上的表现超过了封闭源的GPT-4o模型，并且在效率上比以文本为中心的多阶段方法提高了3.4倍。

Visual Haystacks 基准测试

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

下一篇： PopPop AI：免费在线AI 音效生成器，输入提示词就能生成音效

暂时木有评论

查看更多商品