阿里巴巴开源Qwen2系列模型,包含5个尺寸的预训练和指令微调模型

分类:大语言模型 | 热度:118 ℃

阿里在4月份发布最后一个Qwen1.5模型后,在昨晚正式开源了Qwen2系列模型。这一次,阿里为大家带来了:

  • 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B
  • 在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;
  • 多个评测基准上的领先表现;
  • 代码和数学能力显著提升;
  • 增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。

Qwen2系列包含5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。

项目主页:https://qwenlm.github.io/zh/blog/qwen2

GitHub:https://github.com/QwenLM/Qwen2

模型地址:

  • https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f
  • https://www.modelscope.cn/organization/qwen

阿里巴巴开源Qwen2系列模型,包含5个尺寸的预训练和指令微调模型

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论