昨日,西湖心辰宣布推出心辰Lingo语音大模型,标志着国内在端到端语音技术领域迈出了重要一步。该模型在中文语音处理上进行了特别优化,官方宣称其效果超越了GPT-4o。
- 内测申请地址:https://lingo.xinchenai.com
心辰Lingo的技术亮点
心辰Lingo语音大模型自8月24日启动内测以来,已吸引超过千家企业用户预约体验。与传统的文本到语音(TTS)技术相比,端到端语音大模型提供了一种更全面的解决方案,涵盖了语音识别、自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音输出的无缝交互。
三大技术特性:
- 原生的语音理解能力:心辰Lingo能够精准识别语音中的文字信息,并捕捉情感、语气、音调等重要特征。
- 多样的语音风格表达:模型可以根据上下文和用户指令,智能调整语音的速度、音高、音量,并支持生成对话、歌唱、相声等多样化的语音响应。
- 语音模态超级压缩技术:采用高压缩率的语音编解码器,大幅降低计算和存储成本,提高应用效率。
0条评论