当前位置：首页 > 情报 >AI情报>文章详情

OpenAI在DevDay 2024推出新工具，助力开发者构建AI应用

7个月前 (10-02) | 分类： AI情报 | 热度： 121 ℃

暂无评论

在 DevDay 2024 活动期间，OpenAI 发布了几项新工具，旨在帮助开发者更便捷地创建高性能的人工智能应用程序。以下是本次发布的四大亮点：

1. Realtime API 公开测试版发布

OpenAI 推出了 Realtime API 的公开测试版，允许开发者在应用中实现低延迟、多模态的交互体验。这意味着开发者可以构建类似 ChatGPT 的语音交互应用，并支持六种预设语音的自然对话功能。对于那些不需要 Realtime API 低延迟特性的应用，OpenAI 还在 Chat Completions API 中增加了对音频输入和输出的支持。

地址：https://openai.com/index/introducing-the-realtime-api

Realtime API 的费用为：文本输入每百万个 Token 收费 $5 ，输出每百万个 T o k e n 收费$ 20；音频输入每百万个 Token 收费 $100 ，输出每百万个 T o k e n 收费$ 200。换算下来，音频输入每分钟约需 $0.06 ，音频输出每分钟约需$ 0.24。

2. GPT-4o 视觉微调功能上线

OpenAI 推出了 GPT-4o 的视觉微调功能，使开发者能够利用图像和文本对模型进行定制化训练。这项功能特别适用于增强视觉搜索能力、改进自动驾驶车辆的对象识别、以及实现精准的医学图像分析等领域。目前，所有使用 GPT-4o 最新快照‘gpt-4o-2024-08-06’的付费用户都可以使用视觉微调功能。OpenAI 还提供了截至 2024 年 10 月 31 日每日 100 万个免费训练 Token 的优惠。之后，微调训练每百万个 Token 将收费 $25 ，推理则每百万个输入 T o k e n 收费$ 3.75，每百万个输出 Token 收费 $15。

地址：https://openai.com/index/introducing-vision-to-the-fine-tuning-api

3. 引入 Prompt Caching 支持

OpenAI 追随 Google 和 Anthropic 的步伐，推出了 Prompt Caching 支持，帮助开发者降低延迟和成本。通过 Prompt Caching，开发者可以享受高达 50% 的折扣以及更快的响应时间。更重要的是，Prompt Caching 无需额外配置即可自动应用于 GPT-4o、GPT-4o mini、o1-preview 及其微调版本的最新版本。

地址：https://openai.com/index/api-prompt-caching

4. 新增模型蒸馏套件

OpenAI 还发布了一个模型蒸馏套件，让开发者能够利用大型模型的输出来微调小型模型，从而在特定任务上实现高性能的同时降低成本。这项工具简化了模型蒸馏的过程，并提供了完整的蒸馏流程支持。OpenAI 同样提供了每日一定数量的免费训练 Token，直至 10 月 31 日，之后的费用将按照标准微调定价执行。