当前位置：首页 > 情报 >AI情报>文章详情

谷歌发布两款全新Gemini模型： Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

7个月前 (09-24) | 分类： AI情报 | 热度： 6 ℃

暂无评论

谷歌今天发布了两款全新的Gemini AI模型， Gemini-1.5-Pro-002和Gemini-1.5-Flash-002，不仅性能大幅提升，而且价格更加亲民！这些新模型在数学、长文本和视觉方面取得了巨大进步，无论是处理千页PDF，还是编写代码，或是分析小时级视频，都能轻松应对。
1️⃣价格直降：Pro版输入输出价格直降50%！
2️⃣速度飞跃：输出速度翻倍，延迟减少3倍！
3️⃣限制放宽：Flash版速率限制翻倍，Pro版更是提升了3倍！

以下是官方介绍全文翻译：

今天，我们推出了两款更新的、准备好投入生产的Gemini模型：Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。随附的更新包括：

Gemini-1.5-Pro（对于提示小于128K的情况，输入和输出价格均降低了50%以上）
Gemini-1.5-Flash的速率限制提高了2倍，而Gemini-1.5-Pro提高了约3倍
输出速度提高了2倍，延迟降低了3倍
更新了默认的过滤设置

这些新模型基于我们最新的实验模型发布，并包含了对5月份Google I/O上发布的Gemini 1.5模型的有意义的改进。开发者现在可以通过Google AI Studio和Gemini API免费访问我们的最新模型。对于大型组织和Google Cloud客户，这些模型也在Vertex AI上可用。

整体质量有所提高，在数学、长文本和视觉方面取得了更大的进步

Gemini 1.5系列模型是为广泛的文本、代码和多模态任务设计的通用性能模型。例如，Gemini模型可以用来从1000页的PDF中合成信息，回答包含超过1万行代码的代码库的问题，处理长达一小时的视频并从中创建有用的内容等。

随着最新的更新，1.5 Pro和Flash现在在生产中构建更好、更快、更具成本效益。我们在MMLU-Pro中看到了约7%的增长，这是流行的MMLU基准的一个更具挑战性的版本。在MATH和HiddenMath（内部竞赛数学问题的保留集）基准上，两个模型都取得了约20%的显著进步。对于视觉和代码用例，两个模型在衡量视觉理解和Python代码生成的评估中也表现更好（从约2-7%）。

谷歌发布两款全新Gemini模型： Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

我们还提高了模型响应的整体有用性，同时继续坚持我们的内容安全政策和标准。这意味着在许多主题上，拒绝的次数更少，帮助性回应更多。

根据开发者的反馈，两个模型现在都有了更简洁的风格，旨在使这些模型更易于使用并降低成本。对于摘要、问答和提取等用例，默认的输出长度比之前的模型短约5-20%。对于用户可能更喜欢默认更长回应的基于聊天的产品，你可以阅读我们的提示策略指南，了解更多如何使模型更详细和会话性。

有关迁移到Gemini 1.5 Pro和1.5 Flash最新版本的更多详细信息，请查看Gemini API模型页面。

Gemini 1.5 Pro

我们对Gemini 1.5 Pro的200万个Token长文本窗口和多模态能力的创造性和有用应用感到惊叹。从视频理解到处理1000页PDF，还有许多新的用例有待构建。今天我们宣布，对于我们最强大的1.5系列模型Gemini 1.5 Pro，输入Token的价格降低了64%，输出Token的价格降低了52%，增量缓存Token的价格降低了64%，从2024年10月1日起生效，适用于提示少于128K Token的情况。结合上下文缓存，这继续降低了使用Gemini构建的成本。

谷歌发布两款全新Gemini模型： Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

提高速率限制

为了让开发者更容易地使用Gemini构建，我们将1.5 Flash的付费层速率限制提高到2,000 RPM，将1.5 Pro提高到1,000 RPM，之前分别是1,000和360。在接下来的几周里，我们希望继续提高Gemini API速率限制，以便开发者可以使用更多的Gemini构建。

2倍更快的输出和3倍更低的延迟

随着我们最新模型的核心改进，在过去的几周里，我们已经降低了1.5 Flash的延迟，并显著提高了每秒输出Token的数量，使我们最强大的模型能够使用新用例。

谷歌发布两款全新Gemini模型： Gemini-1.5-Pro-002和Gemini-1.5-Flash-002

更新过滤设置

自2023年12月首次推出Gemini以来，构建一个安全和可靠的模型一直是我们关注的重点。在Gemini的最新版本002模型中，我们改进了模型遵循用户指令的能力，同时平衡了安全性。我们将继续提供一套安全过滤器，开发者可以将其应用于Google的模型。对于今天发布的模型，过滤器将不会默认应用，以便开发者可以确定最适合其用例的配置。