金科汤姆猫投资的西湖心辰,于今年8月推出了心辰Lingo语音大模型,这标志着国内语音技术的一大步。今天(8月24日),心辰Lingo正式开启了内测预约。
端到端语音技术的革新
8月21日的公告中,西湖心辰官方指出,与传统的文本到语音(TTS)技术相比,心辰Lingo端到端语音大模型是一种更加全面和先进的技术。它不仅能够进行语音识别,还整合了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程,极大地扩展了人机交互的可能性。
心辰Lingo的三大技术特点
- 原生的语音理解:心辰Lingo作为端到端模型,能够识别语音中的文字信息,并精确捕捉情感、语气、音调以及环境音等重要特征,提供更自然和生动的交互体验。
- 多种语音风格表达:心辰Lingo能够根据上下文和用户指令,自适应调整语音的语速、音调、音量,并能生成对话、歌唱、相声等不同风格的语音,增强了模型在不同场景下的适应性和灵活性。
- 语音模态超级压缩:采用高压缩率的编解码技术,心辰Lingo能够在显著降低计算和存储成本的同时,生成高质量的语音内容。
开启内测预约
心辰Lingo语音模型,作为国内首个能力追齐GPT-4o语音能力的模型,其技术实力不容小觑。现在,内测预约已经开启,感兴趣的用户可以参与体验这一创新技术带来的全新语音交互。
0条评论