OpenAI宣布,开发者们期待已久的 GPT-4o 微调功能今日正式上线!同时,开发者将享受每天100万个训练Token的免费额度,直至9月23日。
开发者现在可以使用自定义数据集对GPT-4o进行微调,以更低的成本获得针对特定用例的更高性能。微调使模型能够定制响应的结构和语调,或遵循复杂的特定领域指令。开发者在训练数据集中仅需几十个示例,就能为他们的应用程序产生强大的结果。
从编码到创意写作,微调可以在多个领域显著提升模型性能。这只是一个开始——我们将继续投资于扩展我们的模型定制选项,为开发者提供服务。
开始使用
GPT-4o微调今天对所有付费使用层级的开发者开放。
要开始使用,请访问微调仪表板,点击创建,并从基础模型下拉菜单中选择GPT-4o的特定版本。GPT-4o微调训练的费用是每百万Token 25美元,推理是每百万输入Token 3.75美元,每百万输出Token 15美元。
GPT-4o mini微调也对所有付费使用层级的开发者开放。访问微调仪表板,并选择GPT-4o mini的特定版本。对于GPT-4o mini,我们提供了每天200万个训练Token的免费额度,直至9月23日。
要了解更多关于如何使用微调的信息,请访问我们的文档。
通过GPT-4o微调实现最先进的性能
在过去的几个月里,我们与一些值得信赖的合作伙伴合作,在GPT-4o上测试了微调,并了解了他们的用例。以下是一些成功案例:
Cosine在SWE-bench基准测试中取得了最先进的结果
Cosine的Genie是一个AI软件工程助手,能够独立识别和修复错误,构建功能,并与用户合作重构代码。它能够跨复杂的技术问题进行推理,并以更高的准确性和更少的Token需求对代码进行更改。Genie由微调过的GPT-4o模型驱动,该模型训练于真实软件工程师工作的例子,使模型学会以特定的方式响应。使用这个微调模型,Genie在新的SWE-bench Verified基准测试中取得了43.8%的SOTA得分,这一得分在上周二宣布。
Distyl在BIRD-SQL基准测试中排名第一
Distyl是Fortune 500公司的AI解决方案合作伙伴,在BIRD-SQL基准测试中排名第一,这是领先的文本到SQL基准测试。Distyl微调的GPT-4o在排行榜上实现了71.83%的执行准确率,在查询重构、意图分类、思维链和自我纠正等任务上表现出色,尤其是在SQL生成方面。
数据隐私和安全
微调模型完全由您控制,您完全拥有业务数据的所有权,包括所有输入和输出。这确保您的数据不会被共享或用于训练其他模型。
我们还为微调模型实施了分层的安全缓解措施,以确保它们不会被滥用。例如,我们持续对微调模型运行自动化安全评估,并监控使用情况,以确保应用程序遵守我们的使用政策。
我们很高兴看到您通过微调GPT-4o构建的东西。如果您想探索更多的模型定制选项,请与我们的团队联系——我们很乐意帮助!
0条评论