StabilityAI推出全新开源模型Stable Audio Open:能够生成长达 47 秒的音频样本和音效

分类:AI音频 | 热度:63 ℃

关键信息摘要:

  • Stable Audio Open 是一个开源的文本到音频模型,能够生成长达 47 秒的音频样本和音效。
  • 用户可以创作鼓点、乐器即兴重复段、环境声、拟音以及制作所需的音频元素。
  • 该模型支持音频变化和音频样本的风格转换。

StabilityAI推出了全新的开源模型Stable Audio Open,这是一个专为使用文本提示生成短音频样本、音效和制作元素而优化的开源模型。此次发布是一个重要的里程碑,因为StabilityAI进一步开放了他们的生成音频能力的一部分,以赋予声音设计师、音乐家和创意社区更多的能力。

StabilityAI推出全新开源模型Stable Audio Open:能够生成长达 47 秒的音频样本和音效

什么是 Stable Audio Open?

Stable Audio Open 允许任何人通过简单的文本提示生成长达 47 秒的高质量音频数据。它经过专门训练,非常适合创造鼓点、乐器即兴重复段、环境声、拟音录音以及其他音频样本,用于音乐制作和声音设计。

这次开源发布的一个关键好处是用户可以在自己的定制音频数据上对模型进行微调。例如,一位鼓手可以针对他们自己的鼓录音样本进行微调,以生成新的鼓点。

它与 Stable Audio 有何不同?

StabilityAI的商业产品 Stable Audio 能够制作长达三分钟的高质量完整曲目,具有连贯的音乐结构,以及像音频到音频生成和连贯的多部分音乐作品这样的高级功能。

而 Stable Audio Open 专注于音频样本、音效和制作元素。虽然它能生成短音乐片段,但并不针对完整的歌曲、旋律或人声进行优化。这个开源模型提供了一个窥见生成式 AI 在声音设计中的应用,同时优先考虑与创意社区一起负责任地开发。

新模型是在 FreeSound 和 Free Music Archive 的音频数据上训练的。这使StabilityAI能够在尊重创作者权利的同时创建一个开源音频模型。

入门指南

Stable Audio Open 模型权重可在 Hugging Face 平台上获取。StabilityAI鼓励声音设计师、音乐家、开发者和音频爱好者下载模型,探索其功能并提供反馈。

 

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论