MMLU

优惠 大型多任务语言理解(MMLU)基准测试进行深入分析和纠错

  • 大型多任务语言理解(MMLU)基准测试进行深入分析和纠错
    AI
  • 爱丁堡大学、 罗马大学、巴里理工大学、伦敦大学学院、特伦托大学、 AssemblyAI和 英国卫生安全局的研究人员对一个流行的大型多任务语言理解(MMLU)基准测试进行深入分析和纠错,MMLU是用来评估大型语言模型(LLMs)在多种语言任务上的表现,比如历史、数学、计算机科学等领域。但论文作者发现,尽管MMLU被广泛使... 阅读全文