谷歌发布经济实惠的AI新模型Gemini 1.5 Flash 8B

| 分类: AI情报 | 热度: 17 ℃

自从发布以来,Gemini 1.5 Flash 模型因其速度快且成本效益高而在开发者中迅速流行起来。为了进一步降低使用成本,谷歌在8月宣布了 Gemini 1.5 Flash 8B,这是一个新的实验性 AI 模型,仅使用80亿参数。

经过几周的开发者测试,谷歌今天正式宣布了 Gemini 1.5 Flash 8B 的生产就绪版本。该版本适用于高容量多模态用例、长上下文摘要任务等多种应用场景。与原始的 1.5 Flash 模型相比,新的 1.5 Flash 8B 模型成本降低了50%,提供了2倍的高速率限制,并且在小型提示上的延迟更低。

性能亮点

  • 成本降低:Gemini 1.5 Flash 8B 是迄今为止谷歌最便宜的 AI 模型。
  • 高速率限制:支持每分钟4000个请求(RPM),是以前限制的两倍。
  • 低延迟:在小型提示上的延迟更低,提高了实时应用的响应速度。
  • 性能匹配:在性能方面,1.5 Flash 8B 几乎与5月份发布的 1.5 Flash 模型相匹配。

主要应用场景

  • 聊天:适用于实时聊天和对话系统。
  • 转录:高效处理语音转文字任务。
  • 长上下文语言翻译:支持长文档的翻译和摘要生成。

定价详情

  • 提示:每100万令牌0.0375美元
  • 响应:每100万令牌0.15美元
  • 缓存提示:每100万令牌0.01美元

获取和试用

感兴趣的开发者现在可以通过 Google AI Studio 和 Gemini API 免费试用新的 gemini-1.5-flash-8b 模型。对于付费层的开发者,这个新模型的计费将从10月14日星期一开始。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论