人工智能
优惠 喜马拉雅推出高质量零样本(zero-shot)语音生成模型“Takin AudioLLM”系列
3个月前 (09-19)AI
喜马拉雅Everest团队推出高质量零样本(zero-shot)语音生成模型系列“Takin AudioLLM”。这个系列包括Takin TTS(Text-to-Speech,文本到语音)、Takin VC(Voice Conversion,声音转换)和Takin Morphing(声音变形)三个模型,它们专门设计用于... 阅读全文
优惠 新型检索模型Promptriever:能够像语言模型一样响应指令,为用户提供更自然的搜索体验
3个月前 (09-18)AI
约翰·霍普金斯大学和Samaya AI的研究人员推出新型检索模型Promptriever,它能够像语言模型一样响应指令,为用户提供更自然的搜索体验。简单来说,就像你和一位图书管理员对话,告诉他你想找什么书,他会根据你的描述帮你找到正确的书籍。总的来说,Promptriever通过理解和响应用户的自然语言指令,使得信息检... 阅读全文
优惠 Jumping CoD:让四足机器人在不连续的地形(比如楼梯和跳石头)上进行敏捷、连续、适应地形的跳跃
标签:Jumping CoD
AI
3个月前 (09-18)AI
盛顿大学、谷歌 Deepmind和卡内基梅隆大学的研究人员推出新技术,它能让四足机器人在不连续的地形(比如楼梯和跳石头)上进行敏捷、连续、适应地形的跳跃。这就像是教会机器人在复杂的地面上像动物一样跳跃,而不仅仅是简单地行走。 项目主页:https://yxyang.github.io/jumping_cod GitHu... 阅读全文
优惠 为了符号音乐处理而设计的大规模公共领域MusicXML数据集PDMX
3个月前 (09-18)AI
加州大学圣地亚哥分校推出大规模公共领域MusicXML数据集PDMX,它是为了符号音乐处理而设计的。符号音乐处理是指将音乐以乐谱形式进行分析和生成,这与音频领域的音乐生成不同,它更侧重于音乐的结构和符号表示。 项目主页:https://pnlong.github.io/PDMX.demo GitHub:https://... 阅读全文
优惠 SplatFields:新型的三维(3D)和四维(4D)重建技术
标签:SplatFields
AI
3个月前 (09-18)AI
苏黎世联邦理工学院、Meta和 巴尔格里斯特大学医院的研究人员推出一种新型的三维(3D)和四维(4D)重建技术,名为SplatFields。这项技术的目标是从多个视角的图像中高效地重建出静态场景和动态事件的三维模型,并且能够以神经网络的方式对这些模型进行渲染,使其看起来更加真实。 项目主页:https://markom... 阅读全文