LongICLBench

优惠 基准测试集LongICLBench:大语言模型在处理长篇幅上下文学习任务时的表现

  • 基准测试集LongICLBench:大语言模型在处理长篇幅上下文学习任务时的表现
    AI
  • 来自滑铁卢大学、卡内基·梅隆大学和Vector Institute探讨了大语言模型(LLMs)在处理长篇幅上下文学习任务时的表现。研究者们发现,尽管LLMs在处理短上下文任务时表现出色,但当上下文长度增加时,它们的性能会显著下降。为了更全面地评估LLMs在长上下文学习中的能力,研究者们创建了一个专门的基准测试集Long... 阅读全文