在 DevDay 2024 活动期间,OpenAI 发布了几项新工具,旨在帮助开发者更便捷地创建高性能的人工智能应用程序。以下是本次发布的四大亮点:
1. Realtime API 公开测试版发布
OpenAI 推出了 Realtime API 的公开测试版,允许开发者在应用中实现低延迟、多模态的交互体验。这意味着开发者可以构建类似 ChatGPT 的语音交互应用,并支持六种预设语音的自然对话功能。对于那些不需要 Realtime API 低延迟特性的应用,OpenAI 还在 Chat Completions API 中增加了对音频输入和输出的支持。
Realtime API 的费用为:文本输入每百万个 Token 收费 20;音频输入每百万个 Token 收费 200。换算下来,音频输入每分钟约需 0.24。
2. GPT-4o 视觉微调功能上线
OpenAI 推出了 GPT-4o 的视觉微调功能,使开发者能够利用图像和文本对模型进行定制化训练。这项功能特别适用于增强视觉搜索能力、改进自动驾驶车辆的对象识别、以及实现精准的医学图像分析等领域。目前,所有使用 GPT-4o 最新快照‘gpt-4o-2024-08-06’的付费用户都可以使用视觉微调功能。OpenAI 还提供了截至 2024 年 10 月 31 日每日 100 万个免费训练 Token 的优惠。之后,微调训练每百万个 Token 将收费 3.75,每百万个输出 Token 收费 $15。
3. 引入 Prompt Caching 支持
OpenAI 追随 Google 和 Anthropic 的步伐,推出了 Prompt Caching 支持,帮助开发者降低延迟和成本。通过 Prompt Caching,开发者可以享受高达 50% 的折扣以及更快的响应时间。更重要的是,Prompt Caching 无需额外配置即可自动应用于 GPT-4o、GPT-4o mini、o1-preview 及其微调版本的最新版本。
4. 新增模型蒸馏套件
OpenAI 还发布了一个模型蒸馏套件,让开发者能够利用大型模型的输出来微调小型模型,从而在特定任务上实现高性能的同时降低成本。这项工具简化了模型蒸馏的过程,并提供了完整的蒸馏流程支持。OpenAI 同样提供了每日一定数量的免费训练 Token,直至 10 月 31 日,之后的费用将按照标准微调定价执行。
通过这些新工具和服务,OpenAI 降低了开发者的创新门槛,促进了人工智能技术的发展和应用。
0条评论