MetaVoice 1B是一个拥有12亿参数的基础TTS模型,支持语音克隆,目前仅支持英文,支持英式发音和美式发音。它在100,000小时的语音数据上进行了训练,用于文本到语音(TTS)转换。MetaVoice-1B在Apache 2.0许可证下发布,你可以无限制地使用。
GitHub地址:https://github.com/metavoiceio/metavoice-src
模型地址:https://huggingface.co/metavoiceio/metavoice-1B-v0.1
Demo地址:https://ttsdemo.themetavoice.xyz
该模型的建设遵循以下优先级:
- 英语的情感语音节奏和语调。没有幻觉。
- 支持(跨语言的)声音克隆,并通过微调进行优化。
- 我们已经成功地使用印度发音者仅1分钟的训练数据。
- 无需样本克隆美国和英国口音,仅需要30秒的参考音频。
- 支持长篇合成
0条评论