当前位置：首页 > 情报 >AI情报>文章详情

OpenAI推出全新Whisper API：音频秒变文本，还支持英文翻译和时间戳定位！

1年前 (2024-02-10) | 分类： AI情报 | 热度： 236 ℃

暂无评论

OpenAI最新推出了一个超酷的音频到文本的API，基于其强大的Whisper模型。想知道这个API有多厉害吗？它能直接将任何音频内容转录成文字，而且还能翻译成英文哦！更重要的是，它还能告诉你每个词或句子在音频中出现的具体时间点，让你轻松定位到音频中的精彩瞬间！（详情）

🌟主要功能亮点🌟

音频秒变文字：不管是会议录音、讲座、还是你的个人语音备忘录，只要上传音频文件，Whisper API就能帮你快速转换成文字，让你轻松阅读。
多语言翻译转录：如果你的音频内容是其他语言，不用担心！这个API会先将其翻译成英文，再进行转录，让非英语内容也能变成清晰的文本。
精确时间戳定位：通过timestamp_granularities[]参数，API会提供带有时间戳的结构化JSON输出。这意味着你可以知道每个词或句子在音频中的确切时间点，方便你回顾和定位关键内容。
广泛支持音频格式：无论是mp3、mp4、mpeg、mpga、m4a、wav还是webm，只要是25MB以内的文件，你都可以直接上传使用，无需转换格式。