阿里发布新一代数学模型Qwen2-Math

分类:大语言模型 | 热度:132 ℃

阿里通义千问 Qwen2 家族的新成员 Qwen2-Math,以其强大的数学解题能力,为开源语言模型领域带来了新的突破。以下是对 Qwen2-Math 的简介和性能概述,以及其多语言模型开发计划的介绍。

  • 项目主页:https://qwenlm.github.io/zh/blog/qwen2-math
  • GitHub:https://github.com/QwenLM/Qwen2-Math

Qwen2-Math 简介

Qwen2-Math 是一系列基于 Qwen2 大语言模型(LLM)构建的专门用于数学解题的语言模型。该系列模型共有三个版本,分别拥有 15 亿、70 亿和 720 亿参数,旨在提供超越现有开源及闭源模型的数学能力。

目标与贡献:Qwen2-Math 的开发团队希望这一新模型能够为科学界解决那些需要复杂多步逻辑推理的高级数学问题,从而为学术研究和教育领域做出贡献。

Qwen2-Math 性能

在数学领域的基准评测中,Qwen2-Math 展现了卓越的性能。特别是其最大的模型版本 Qwen2-Math-72B-Instruct,在 Math 基准上的评测结果超越了包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B 等在内的多个最先进的模型。

多语言模型开发

虽然当前的 Qwen2-Math 模型系列专注于数学能力,并且仅支持英文,但开发团队已经宣布了扩展语言支持的计划。他们将推出支持英文和中文的双语模型,并进一步开发多语言模型,以满足更广泛用户群体的需求。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论