自从发布以来,Gemini 1.5 Flash 模型因其速度快且成本效益高而在开发者中迅速流行起来。为了进一步降低使用成本,谷歌在8月宣布了 Gemini 1.5 Flash 8B,这是一个新的实验性 AI 模型,仅使用80亿参数。
经过几周的开发者测试,谷歌今天正式宣布了 Gemini 1.5 Flash 8B 的生产就绪版本。该版本适用于高容量多模态用例、长上下文摘要任务等多种应用场景。与原始的 1.5 Flash 模型相比,新的 1.5 Flash 8B 模型成本降低了50%,提供了2倍的高速率限制,并且在小型提示上的延迟更低。
性能亮点
- 成本降低:Gemini 1.5 Flash 8B 是迄今为止谷歌最便宜的 AI 模型。
- 高速率限制:支持每分钟4000个请求(RPM),是以前限制的两倍。
- 低延迟:在小型提示上的延迟更低,提高了实时应用的响应速度。
- 性能匹配:在性能方面,1.5 Flash 8B 几乎与5月份发布的 1.5 Flash 模型相匹配。
主要应用场景
- 聊天:适用于实时聊天和对话系统。
- 转录:高效处理语音转文字任务。
- 长上下文语言翻译:支持长文档的翻译和摘要生成。
定价详情
- 提示:每100万令牌0.0375美元
- 响应:每100万令牌0.15美元
- 缓存提示:每100万令牌0.01美元
获取和试用
感兴趣的开发者现在可以通过 Google AI Studio 和 Gemini API 免费试用新的 gemini-1.5-flash-8b 模型。对于付费层的开发者,这个新模型的计费将从10月14日星期一开始。
0条评论