CV声音工具是一款基于 coqui-tts 带 web 界面的声音克隆工具,使用你的音色或任意声音来录制音频,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。使用非常简单,没有显卡也可以使用,下载预编译版本,双击 app.exe 打开一个 web 界面,点点鼠标就能用。支持 中文 、 英文 、 日语 、 韩语 4 种语言,可在线从麦克风录制声音。为保证合成效果,建议录制时长 5 秒到 20 秒,发音清晰准确,不要存在背景噪声。
下载地址:https://www.123pan.com/s/I1oZVv-bjuGA.html 提取码:BLIv
使用方法
1、下载预编译版,适用于window 10/11(已含文字到语音模型,语音到语音模型需单独下载),Mac下请拉取源码自行编译
2、下载后解压到某处,比如 E:/clone-voice 下
3、双击 start.bat ,等待自动打开web窗口,如下
4、输入文字或者上传想转换的音频文件,然后录制或从本地上传一段音色文件,开始转换
5、为减小体积,预编译版仅支持CPU,只包含文字到语音模型
如果需要语音到语音功能,即上传一个音频文件,然后将该音频转换为使用选定音色的另一个音频,需单独下载语音到语音(speech-to-speech)模型,然后放到和app.exe同级的tts文件夹中,右键“解压到当前文件夹下” 解压后
6、如需GPU支持,请拉取源码本地编译
0条评论