情报 针对 ChatGPT Plus 订阅者的语音功能将于下周发布

去年五月,OpenAI 公司推出了其革命性旗舰模型 GPT-4o,特别强调了音频理解能力,旨在提供与人类对话相似的响应体验。GPT-4o 的平均响应时间仅为 320 毫秒,显著提升了语音交互的流畅度。OpenAI 表示,这是他们首次将文本、视觉和音频集成于一体的模型,通过端到端的训练,所有输入和输出都由同一神经网络处理... 阅读全文