MMEVALPRO

优惠 新型多模态评估基准MMEVALPRO:检验和校准大型多模态模型的评估方法,以确保评估结果既可靠又高效

  • 新型多模态评估基准MMEVALPRO:检验和校准大型多模态模型的评估方法,以确保评估结果既可靠又高效
    AI
  • 北京大学、国医学科学院、香港中文大学和阿里巴巴集团的研究人员推出新型多模态评估基准MMEVALPRO,它专门设计用来检验和校准大型多模态模型(LMMs)的评估方法,以确保评估结果既可靠又高效。例如,我们有一个问题:“图中的植物有几种不同的叶子形状?”原始答案可能是“三种”。但MMEVALPRO会进一步询问:“你能描述这... 阅读全文