Hume AI 推出了一款名为EVI 2的新型语音交互基础模型。EVI 2 将语言理解和语音生成融合在一个模型中,这个模型特别针对情感智能进行了训练。它能够模拟多种个性、口音和说话风格,并且具备自然发展的多语言能力。它能够迅速且流畅地与用户对话,响应时间在毫秒级,理解用户的语调,生成任何语调,甚至还能响应一些更小众的请求,比如改变其说话速度或说唱。它可以模拟广泛的个性、口音和说话风格,并具备突发的多语言能力。
- 地址:https://www.hume.ai
在更高层次上,EVI 2 擅长预测并适应你的偏好,这得益于其特殊的情感智能训练。它被训练以塑造有趣且令人感兴趣的角色和个性。综合来看,EVI 2 旨在模拟每个应用和每个用户的理想 AI 个性。
开始使用 EVI 2
今天,EVI 2 以 beta 版本对所有人开放使用。你可以通过Hume AI的应用程序与它交谈,也可以通过Hume AI的 API 将其构建到应用程序中(遵守Hume AI的指导方针)。
重要的是,EVI 2 无法在不修改其代码的情况下克隆声音。这是故意设计的:Hume AI认为声音克隆有独特的风险。通过在模型架构层面控制其与身份相关的声音特征,Hume AI引导模型一次采用一个声音身份,并在会话中保持它。
但Hume AI仍然希望给用户和开发者提供适应 EVI 2 声音以满足他们独特偏好和要求的能力。为此,Hume AI开发了一种实验性的声音调制方法,允许任何人创建合成声音和个性。开发者可以在包括性别、鼻音、音高等多个连续尺度上调整 EVI 2 的基础声音。这种首创的功能让你可以为特定应用和用户创建定制的声音,而无需声音克隆的风险。
下一步是什么?
Hume AI今天推出的模型是 EVI-2-small。Hume AI仍在对这个模型进行改进——在未来几周内,它将变得更可靠,学习更多语言,遵循更复杂的指令,并使用更广泛的工具。Hume AI也在微调 EVI-2-large,Hume AI很快将宣布。
EVI 2 代表了Hume AI在优化 AI 以促进人类福祉方面的一个关键步骤。Hume AI专注于使其声音和个性高度适应,以提供更多优化用户幸福和满意度的可能性。毕竟,个性是Hume AI互动过程中许多微妙、毫秒级决策的融合,而 EVI 2 展示了为福祉优化的 AI 将因其与你的更深层次的目标对齐而具有特别愉快和有趣的个性。Hume AI正在进行的研究专注于自动优化每个用户的偏好,采用方法微调模型以生成与日常使用应用程序期间幸福和满意度迹象相一致的响应。
0条评论