从本周二开始,OpenAI 公司将为 ChatGPT 的付费用户推出一项新功能——高级语音模式(AVM)。这项升级旨在让 ChatGPT 的对话听起来更自然,更接近人类的语音。初期,这项功能将面向 ChatGPT Plus 和 Teams 级别的用户开放,企业用户和教育用户也将在下周开始体验。
界面升级,新声音加入
AVM 的界面也进行了更新,现在由一个蓝色的动态球体代表,取代了之前五月份展示中使用的动态黑点。用户可以在 ChatGPT 应用的声音图标旁边看到一个弹出窗口,提示他们可以使用 AVM 功能。
此外,ChatGPT 还新增了五种声音供用户选择:Arbor、Maple、Sol、Spruce 和 Vale,使得 ChatGPT 的声音总数达到九种,与 Google 的 Gemini Live 相仿。这些新声音的命名都与自然元素有关,反映出 AVM 旨在使 ChatGPT 的使用体验更加自然。
法律争议与功能缺席
值得注意的是,此次更新中没有包括之前展示的 Sky 声音。这是因为斯嘉丽·约翰逊曾提出法律威胁,她认为 Sky 的声音与她在电影《她》中扮演的 AI 角色的声音过于相似。OpenAI 随后撤下了 Sky 声音,并声明从未打算模仿约翰逊的声音。
同样在此次更新中缺席的还有 ChatGPT 的视频和屏幕共享功能,该功能在四个月前的春季更新中首次亮相。这项功能预计将让 GPT-4 同时处理视觉和听觉信息,但目前 OpenAI 尚未提供这些多模态功能的推出时间表。
改进与定制
尽管存在一些缺席的功能,OpenAI 表示自发布 AVM 的有限 alpha 测试以来,已经进行了一些改进。ChatGPT 的语音功能现在更善于理解口音,对话也变得更加流畅和快速。
此外,OpenAI 还将 ChatGPT 的一些定制功能扩展到 AVM,包括自定义指令和内存功能,允许 ChatGPT 记住之前的对话以供后续参考。
地区限制
最后,OpenAI 的一位发言人表示,AVM 目前尚未在包括欧盟、英国、瑞士、冰岛、挪威和列支敦士登在内的几个地区推出。
0条评论