RULER

栏目分类

推荐人：暴走AI 标签：RULER AI

1年前 (2024-04-11)AI

英伟达推出新基准测试RULER，它旨在更全面地评估长上下文语言模型（Long-Context LMs）的性能。想象一下，你有一个超级聪明的助手，它可以阅读和理解非常长的文本，比如整本书或大量的文章，并且能够记住所有的细节，以便在需要时找到特定的信息。这就是长上下文语言模型尝试做的事情，而RULER就是用来测试这些模型是... 阅读全文

直达链接好 0 不好 0 已关闭评论