情报 Scale AI 发布首个大语言模型排行榜,对特定领域的AI模型性能进行排名

人工智能训练数据提供商 Scale AI Inc. 近日发布了其首个 SEAL 排行榜,这是一个旨在对大型语言模型(LLM)在多种使用案例中的能力进行评级的系统。 SEAL排行榜亮点 OpenAI GPT系列:在四个评估领域中,三个领域排名第一。 Anthropic Claude 3 Opus:在第四个领域夺得首位。 ... 阅读全文