谷歌发布两款全新Gemini模型: Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

| 分类: AI情报 | 热度: 4 ℃

谷歌今天发布了两款全新的Gemini AI模型, Gemini-1.5-Pro-002和Gemini-1.5-Flash-002,不仅性能大幅提升,而且价格更加亲民!这些新模型在数学、长文本和视觉方面取得了巨大进步,无论是处理千页PDF,还是编写代码,或是分析小时级视频,都能轻松应对。
1️⃣价格直降:Pro版输入输出价格直降50%!
2️⃣速度飞跃:输出速度翻倍,延迟减少3倍!
3️⃣限制放宽:Flash版速率限制翻倍,Pro版更是提升了3倍!

谷歌发布两款全新Gemini模型: Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

以下是官方介绍全文翻译:

今天,我们推出了两款更新的、准备好投入生产的Gemini模型:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。随附的更新包括:

  • Gemini-1.5-Pro(对于提示小于128K的情况,输入和输出价格均降低了50%以上)
  • Gemini-1.5-Flash的速率限制提高了2倍,而Gemini-1.5-Pro提高了约3倍
  • 输出速度提高了2倍,延迟降低了3倍
  • 更新了默认的过滤设置

这些新模型基于我们最新的实验模型发布,并包含了对5月份Google I/O上发布的Gemini 1.5模型的有意义的改进。开发者现在可以通过Google AI StudioGemini API免费访问我们的最新模型。对于大型组织和Google Cloud客户,这些模型也在Vertex AI上可用。

整体质量有所提高,在数学、长文本和视觉方面取得了更大的进步

Gemini 1.5系列模型是为广泛的文本、代码和多模态任务设计的通用性能模型。例如,Gemini模型可以用来从1000页的PDF中合成信息,回答包含超过1万行代码的代码库的问题,处理长达一小时的视频并从中创建有用的内容等。

随着最新的更新,1.5 Pro和Flash现在在生产中构建更好、更快、更具成本效益。我们在MMLU-Pro中看到了约7%的增长,这是流行的MMLU基准的一个更具挑战性的版本。在MATH和HiddenMath(内部竞赛数学问题的保留集)基准上,两个模型都取得了约20%的显著进步。对于视觉和代码用例,两个模型在衡量视觉理解和Python代码生成的评估中也表现更好(从约2-7%)。

谷歌发布两款全新Gemini模型: Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

我们还提高了模型响应的整体有用性,同时继续坚持我们的内容安全政策和标准。这意味着在许多主题上,拒绝的次数更少,帮助性回应更多。

根据开发者的反馈,两个模型现在都有了更简洁的风格,旨在使这些模型更易于使用并降低成本。对于摘要、问答和提取等用例,默认的输出长度比之前的模型短约5-20%。对于用户可能更喜欢默认更长回应的基于聊天的产品,你可以阅读我们的提示策略指南,了解更多如何使模型更详细和会话性。

有关迁移到Gemini 1.5 Pro和1.5 Flash最新版本的更多详细信息,请查看Gemini API模型页面。

Gemini 1.5 Pro

我们对Gemini 1.5 Pro的200万个Token长文本窗口和多模态能力的创造性和有用应用感到惊叹。从视频理解到处理1000页PDF,还有许多新的用例有待构建。今天我们宣布,对于我们最强大的1.5系列模型Gemini 1.5 Pro,输入Token的价格降低了64%,输出Token的价格降低了52%,增量缓存Token的价格降低了64%,从2024年10月1日起生效,适用于提示少于128K Token的情况。结合上下文缓存,这继续降低了使用Gemini构建的成本。

谷歌发布两款全新Gemini模型: Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

提高速率限制

为了让开发者更容易地使用Gemini构建,我们将1.5 Flash的付费层速率限制提高到2,000 RPM,将1.5 Pro提高到1,000 RPM,之前分别是1,000和360。在接下来的几周里,我们希望继续提高Gemini API速率限制,以便开发者可以使用更多的Gemini构建。

2倍更快的输出和3倍更低的延迟

随着我们最新模型的核心改进,在过去的几周里,我们已经降低了1.5 Flash的延迟,并显著提高了每秒输出Token的数量,使我们最强大的模型能够使用新用例。

谷歌发布两款全新Gemini模型: Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

更新过滤设置

自2023年12月首次推出Gemini以来,构建一个安全和可靠的模型一直是我们关注的重点。在Gemini的最新版本002模型中,我们改进了模型遵循用户指令的能力,同时平衡了安全性。我们将继续提供一套安全过滤器,开发者可以将其应用于Google的模型。对于今天发布的模型,过滤器将不会默认应用,以便开发者可以确定最适合其用例的配置。

Gemini 1.5 Flash-8B实验更新

我们发布了8月份宣布的Gemini 1.5模型的进一步改进版本,称为“Gemini-1.5-Flash-8B-Exp-0924”。这个改进版本在文本和多模态用例中的性能都有显著提升。它现在可以通过Google AI Studio和Gemini API获得。

开发者对1.5 Flash-8B的压倒性积极反馈令人难以置信,我们将继续根据开发者的反馈塑造我们的从实验到生产发布的管道。

我们对这些更新感到兴奋,迫不及待地想看看你们将用新的Gemini模型构建什么!对于Gemini Advanced用户,你很快就能够访问Gemini 1.5 Pro-002的聊天优化版本。(来源

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论