MM-NIAH

优惠 新基准测试MM-NIAH:用来评估多模态大语言模型理解长篇多模态文档的能力

  • 新基准测试MM-NIAH:用来评估多模态大语言模型理解长篇多模态文档的能力
    AI
  • 上海人工智能实验室OpenGVLab、复旦大学、清华大学、香港中文大学、南京大学、商汤科技研究院和香港大学的研究人员推出新基准测试MM-NIAH,专门用来评估多模态大语言模型(MLLMs)理解长篇多模态文档的能力。例如,我们有一个包含多个图像和文本段落的长文档,其中描述了一个病例。MM-NIAH基准测试要求模型在文档中... 阅读全文