微软今天宣布了其Phi系列生成式AI模型的新成员——Phi-4。这款新模型在多个方面实现了显著的进步,特别是在数学问题解决能力上有了长足的发展。这一进步主要归因于训练数据质量的提升,以及采用了“高质量的合成数据集”和人类生成内容的数据集。
有限的访问权限
截至12月12日晚,Phi-4的访问权限仍然非常有限。目前,它仅能在微软最新推出的Azure AI Foundry开发平台上使用,并且仅限于研究目的,需遵守微软的研究许可协议。
竞争环境
作为一款拥有140亿参数的小型语言模型,Phi-4加入了与GPT-4 mini、Gemini 2.0 Flash和Claude 3.5 Haiku等同类产品的竞争行列。这些小型模型通常具有运行速度快、成本低的优势,同时它们的性能在过去几年中也得到了稳步提升。
技术进步的背后
微软指出,Phi-4性能的提高不仅仅依赖于数据的质量,还在于训练后的改进措施。当前,许多AI实验室都在积极探索如何通过合成数据和训练后优化来推动技术革新。Scale AI首席执行官Alexandr Wang也在社交媒体上表达了类似的观点,认为行业已经触及到了预训练数据的极限,这进一步印证了近期关于该领域的讨论。
关键人物的变动
值得注意的是,Phi-4是Sébastien Bubeck离职后微软发布的首个Phi系列模型。Bubeck曾担任微软AI副总裁,在Phi模型的开发过程中扮演了重要角色。他在今年10月离开了微软,加入了OpenAI继续从事AI研究工作。
0条评论