MIRB

优惠 多图像关系基准新评估工具 MIRB:用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型在理解多图像方面的能力

  • 多图像关系基准新评估工具 MIRB:用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型在理解多图像方面的能力
    AI
  • 爱丁堡大学和同济大学的研究人员推出新评估工具 MIRB(Multi-Image Relational Benchmark, 多图像关系基准),用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型(VLMs)在理解多图像方面的能力。论文通过广泛的评估发现,尽管在单图像任务中一些开源的视觉语言模型能够与一些... 阅读全文