Blink

优惠 新型基准测试Blink:专门用于评估多模态大语言模型在核心视觉感知能力方面的表现

  • 新型基准测试Blink:专门用于评估多模态大语言模型在核心视觉感知能力方面的表现
    AI
  • 新型基准测试Blink,它专门用于评估多模态大型语言模型(LLMs)在核心视觉感知能力方面的表现。这些能力往往在其他评估中被忽视,但对于人类来说却是非常直观和本能的,例如相对深度估计、视觉对应、法医检测和多视图推理等任务。Blink基准测试包含14个经典计算机视觉任务,这些任务被重新构想为3,807个多项选择题,配以单... 阅读全文