谷歌今天发布了两款全新的Gemini AI模型, Gemini-1.5-Pro-002和Gemini-1.5-Flash-002,不仅性能大幅提升,而且价格更加亲民!这些新模型在数学、长文本和视觉方面取得了巨大进步,无论是处理千页PDF,还是编写代码,或是分析小时级视频,都能轻松应对。
1️⃣价格直降:Pro版输入输出价格直降50%!
2️⃣速度飞跃:输出速度翻倍,延迟减少3倍!
3️⃣限制放宽:Flash版速率限制翻倍,Pro版更是提升了3倍!
以下是官方介绍全文翻译:
今天,我们推出了两款更新的、准备好投入生产的Gemini模型:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。随附的更新包括:
- Gemini-1.5-Pro(对于提示小于128K的情况,输入和输出价格均降低了50%以上)
- Gemini-1.5-Flash的速率限制提高了2倍,而Gemini-1.5-Pro提高了约3倍
- 输出速度提高了2倍,延迟降低了3倍
- 更新了默认的过滤设置
这些新模型基于我们最新的实验模型发布,并包含了对5月份Google I/O上发布的Gemini 1.5模型的有意义的改进。开发者现在可以通过Google AI Studio和Gemini API免费访问我们的最新模型。对于大型组织和Google Cloud客户,这些模型也在Vertex AI上可用。
整体质量有所提高,在数学、长文本和视觉方面取得了更大的进步
Gemini 1.5系列模型是为广泛的文本、代码和多模态任务设计的通用性能模型。例如,Gemini模型可以用来从1000页的PDF中合成信息,回答包含超过1万行代码的代码库的问题,处理长达一小时的视频并从中创建有用的内容等。
随着最新的更新,1.5 Pro和Flash现在在生产中构建更好、更快、更具成本效益。我们在MMLU-Pro中看到了约7%的增长,这是流行的MMLU基准的一个更具挑战性的版本。在MATH和HiddenMath(内部竞赛数学问题的保留集)基准上,两个模型都取得了约20%的显著进步。对于视觉和代码用例,两个模型在衡量视觉理解和Python代码生成的评估中也表现更好(从约2-7%)。
我们还提高了模型响应的整体有用性,同时继续坚持我们的内容安全政策和标准。这意味着在许多主题上,拒绝的次数更少,帮助性回应更多。
根据开发者的反馈,两个模型现在都有了更简洁的风格,旨在使这些模型更易于使用并降低成本。对于摘要、问答和提取等用例,默认的输出长度比之前的模型短约5-20%。对于用户可能更喜欢默认更长回应的基于聊天的产品,你可以阅读我们的提示策略指南,了解更多如何使模型更详细和会话性。
有关迁移到Gemini 1.5 Pro和1.5 Flash最新版本的更多详细信息,请查看Gemini API模型页面。
Gemini 1.5 Pro
我们对Gemini 1.5 Pro的200万个Token长文本窗口和多模态能力的创造性和有用应用感到惊叹。从视频理解到处理1000页PDF,还有许多新的用例有待构建。今天我们宣布,对于我们最强大的1.5系列模型Gemini 1.5 Pro,输入Token的价格降低了64%,输出Token的价格降低了52%,增量缓存Token的价格降低了64%,从2024年10月1日起生效,适用于提示少于128K Token的情况。结合上下文缓存,这继续降低了使用Gemini构建的成本。
提高速率限制
为了让开发者更容易地使用Gemini构建,我们将1.5 Flash的付费层速率限制提高到2,000 RPM,将1.5 Pro提高到1,000 RPM,之前分别是1,000和360。在接下来的几周里,我们希望继续提高Gemini API速率限制,以便开发者可以使用更多的Gemini构建。
2倍更快的输出和3倍更低的延迟
随着我们最新模型的核心改进,在过去的几周里,我们已经降低了1.5 Flash的延迟,并显著提高了每秒输出Token的数量,使我们最强大的模型能够使用新用例。
更新过滤设置
自2023年12月首次推出Gemini以来,构建一个安全和可靠的模型一直是我们关注的重点。在Gemini的最新版本002模型中,我们改进了模型遵循用户指令的能力,同时平衡了安全性。我们将继续提供一套安全过滤器,开发者可以将其应用于Google的模型。对于今天发布的模型,过滤器将不会默认应用,以便开发者可以确定最适合其用例的配置。
Gemini 1.5 Flash-8B实验更新
我们发布了8月份宣布的Gemini 1.5模型的进一步改进版本,称为“Gemini-1.5-Flash-8B-Exp-0924”。这个改进版本在文本和多模态用例中的性能都有显著提升。它现在可以通过Google AI Studio和Gemini API获得。
开发者对1.5 Flash-8B的压倒性积极反馈令人难以置信,我们将继续根据开发者的反馈塑造我们的从实验到生产发布的管道。
我们对这些更新感到兴奋,迫不及待地想看看你们将用新的Gemini模型构建什么!对于Gemini Advanced用户,你很快就能够访问Gemini 1.5 Pro-002的聊天优化版本。(来源)
0条评论