OpenAI与Google竞争加剧,旗下大语言模型在AI基准测试中轮番登顶

| 分类: AI情报 | 热度: 27 ℃

在当前的人工智能领域,OpenAI与Google之间的竞争尤为引人注目。两家公司不断推出新的大语言模型(LLM),并在AI基准测试中争夺榜首位置。最新的动态显示,这一竞争达到了新的高潮。

  • ChatGPT-4o(20241120):于11月21日成为Chatbot Arena排行榜的第一名,超越了之前由Google发布的Gemini-Exp-1114模型(发布于11月15日)。
  • Gemini-Exp-1206:作为Google今天推出的实验模型,Gemini-Exp-1206迅速反超,在Chatbot Arena中夺得了第一名的位置,并在多个关键类别中名列前茅,包括整体与风格控制、困难提示、编码、数学、创意写作、指令跟随、长查询和多轮对话。

OpenAI与Google竞争加剧,旗下大语言模型在AI基准测试中轮番登顶

Gemini-Exp-1206的卓越表现

Gemini-Exp-1206不仅在整体排名中位居第一,还在以下几个方面表现出色:

  • 编码:与OpenAI的o1并列第一,展示了其在编程任务上的强大能力。
  • 数学:能够处理复杂的数学问题,提供准确的答案。
  • 创意写作:生成高质量的文本内容,适用于文学创作等领域。
  • 指令跟随:能够精确理解并执行用户指令,确保对话的流畅性和准确性。
  • 长查询和多轮对话:擅长处理长时间的对话和复杂的情境,提供了更加自然的交互体验。

OpenAI与Google竞争加剧,旗下大语言模型在AI基准测试中轮番登顶

目前,Gemini-Exp-1206已经在Google AI Studio和Gemini API中向开发者开放,为他们提供了强大的工具来构建和部署AI应用。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论