情报 苹果科学家新论文:大语言模型推理能力不足

苹果公司的AI科学家们在最近发表的一篇论文中指出,基于大语言模型(LLMs)的引擎,例如Meta和OpenAI的产品,仍然缺乏基础的推理能力。为了解决这一问题,该团队开发了一种新的基准测试方法——GSM-Symbolic,旨在衡量各种大型语言模型的推理能力。 论文地址:https://arxiv.org/pdf/241... 阅读全文

情报 Scale AI 发布首个大语言模型排行榜,对特定领域的AI模型性能进行排名

人工智能训练数据提供商 Scale AI Inc. 近日发布了其首个 SEAL 排行榜,这是一个旨在对大型语言模型(LLM)在多种使用案例中的能力进行评级的系统。 SEAL排行榜亮点 OpenAI GPT系列:在四个评估领域中,三个领域排名第一。 Anthropic Claude 3 Opus:在第四个领域夺得首位。 ... 阅读全文

情报 打破语言壁垒!美国AI初创公司Cohere推出开源大模型Aya,覆盖101种语言

美国AI初创公司Cohere于2月13日公布了一款全新的开源多语言生成性大语言模型(LLM),名为Aya,它支持101种不同的语言,这一数字超过了现有开源模型所涵盖语言数量的两倍以上。此外,该公司还发布了迄今为止最大的多语言指令微调数据集,该数据集规模高达5.13亿条样本,涵盖了114种语言。此数据集收集了来自世界各地... 阅读全文