AI音频
优惠 Diversity-Rewarded CFG:提高音乐生成模型在创作过程中的多样性和质量
1个月前 (10-10)AI
谷歌发布论文,论文的主题是关于如何提高音乐生成模型在创作过程中的多样性和质量。想象一下,你是一位音乐制作人,想要创作出既符合某个主题又充满新意的音乐作品。但是,如果你每次创作出来的作品都大同小异,那就会显得很无聊。这篇论文介绍的方法就像是给你一个魔法工具,帮助你在保持音乐质量的同时,也让作品变得更加多样化和有趣。 项目... 阅读全文
优惠 avsoundscape:能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的
标签:avsoundscape
AI
2个月前 (09-24)AI
加州大学伯克利分校、Meta和密歇根大学的研究人员推出Self-Supervised Audio-Visual Soundscape Stylization技术,它能够改变输入语音的声学特性,使其听起来像是在另一个不同的场景中录制的。简单来说,就是可以通过这个技术,把一段语音处理得好像它是在某个特定环境中产生的,比如在... 阅读全文
优惠 SSR-Speech:专为零样本(zero-shot)文本基础的语音编辑和文本到语音(TTS)合成设计
标签:SSR-Speech
AI
2个月前 (09-19)AI
约翰霍普金斯大学、腾讯人工智能实验室和南洋理工大学的研究人员推出新型神经编解码自回归模型SSR-Speech,它专为零样本(zero-shot)文本基础的语音编辑和文本到语音(TTS)合成设计,以实现稳定、安全和强大的性能。简单来说,SSR-Speech 能够根据文本指令修改或合成语音,而不需要在训练期间听到特定的说话... 阅读全文
优惠 喜马拉雅推出高质量零样本(zero-shot)语音生成模型“Takin AudioLLM”系列
2个月前 (09-19)AI
喜马拉雅Everest团队推出高质量零样本(zero-shot)语音生成模型系列“Takin AudioLLM”。这个系列包括Takin TTS(Text-to-Speech,文本到语音)、Takin VC(Voice Conversion,声音转换)和Takin Morphing(声音变形)三个模型,它们专门设计用于... 阅读全文
优惠 为了符号音乐处理而设计的大规模公共领域MusicXML数据集PDMX
2个月前 (09-18)AI
加州大学圣地亚哥分校推出大规模公共领域MusicXML数据集PDMX,它是为了符号音乐处理而设计的。符号音乐处理是指将音乐以乐谱形式进行分析和生成,这与音频领域的音乐生成不同,它更侧重于音乐的结构和符号表示。 项目主页:https://pnlong.github.io/PDMX.demo GitHub:https://... 阅读全文