MMLU

栏目分类

推荐人：暴走AI 标签：MMLU 大型多任务语言 AI

10个月前 (06-17)AI

爱丁堡大学、罗马大学、巴里理工大学、伦敦大学学院、特伦托大学、 AssemblyAI和英国卫生安全局的研究人员对一个流行的大型多任务语言理解（MMLU）基准测试进行深入分析和纠错，MMLU是用来评估大型语言模型（LLMs）在多种语言任务上的表现，比如历史、数学、计算机科学等领域。但论文作者发现，尽管MMLU被广泛使... 阅读全文

直达链接好 0 不好 0 已关闭评论