阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,例如相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。迄今通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型;Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小;多语言能力方面,通义千问团队选取了12种语言,在考试、理解、数学及翻译等多个领域做了测评,Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
声明:
猎游人
每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料
猜你喜欢
- Simular推出新型框架Agent S:以让计算机像人类一样通过图形用户界面(GUI)自主执行复杂的多步骤任务
- GLOV:利用大语言模型(LLMs)来优化视觉-语言模型(VLMs)的技术,目的是提升下游视觉任务的性能
- 新型视频理解模型TRACE:专门设计来处理视频时间定位任务
- video-t3:提高视频大型语言模型(Video LLMs)在处理时间推理方面的能力
- 基于Mamba架构构建的大语言模型Falcon Mamba 7B
- TinyEmo:用于情感推理和分类的小型多模态语言模型系列
- CritiCS:使用大语言模型(LLMs)来创造具有叙事连贯性和创造力的长篇故事
- 新型大型视频语言模型Grounded-VideoLLM:擅长于理解视频中的精细时刻,并能够推理出具体发生在视频哪个时刻的事情
- 互动聊天创新项目Future You:通过让用户与年长版的自己进行对话,减少焦虑,指导年轻人做出更好的选择
- 苹果推出新型多模态大语言模型MM1.5:提升对包含丰富文本的图像理解、视觉指代和定位以及多图像推理的能力
- 语言记忆擦除ELM:从语言模型中“抹去”特定概念的知识
- 工智能辅助工具Tutor CoPilot:通过提供专家级的指导来帮助教育工作者,特别是那些经验不足的教师或家教,以提高他们的教学质量
0条评论