拥有12亿参数的基础TTS模型MetaVoice 1B,支持语音克隆,目前仅支持英文

分类:AI音频 | 热度:232 ℃

MetaVoice 1B是一个拥有12亿参数的基础TTS模型,支持语音克隆,目前仅支持英文,支持英式发音和美式发音。它在100,000小时的语音数据上进行了训练,用于文本到语音(TTS)转换。MetaVoice-1B在Apache 2.0许可证下发布,你可以无限制地使用。

GitHub地址:https://github.com/metavoiceio/metavoice-src

模型地址:https://huggingface.co/metavoiceio/metavoice-1B-v0.1

官网:https://themetavoice.xyz

Demo地址:https://ttsdemo.themetavoice.xyz

拥有12亿参数的基础TTS模型MetaVoice 1B,支持语音克隆,目前仅支持英文

该模型的建设遵循以下优先级:

  1. 英语的情感语音节奏和语调。没有幻觉。
  2. 支持(跨语言的)声音克隆,并通过微调进行优化。
  3. 我们已经成功地使用印度发音者仅1分钟的训练数据。
  4. 无需样本克隆美国和英国口音,仅需要30秒的参考音频。
  5. 支持长篇合成

拥有12亿参数的基础TTS模型MetaVoice 1B,支持语音克隆,目前仅支持英文

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论