本文最后更新于112 天前,其中的信息可能已经过时,如有错误请发送邮件到2678940862@qq.com
项目地址https://github.com/RVC-Boss/GPT-SoVITS
这个与RVC的区别在与这个是模型生成声音,RVC用于(实时)变声,声变声,模型方面似乎不能通用。
训练模型
首先得收集语音素材数据集,并且制作同名.list标注文件,将标注文件放在E:\GPT-SoVITS\GPT-SoVITS-beta0706\output\asr_opt
list中语音素材的地址要改,一一对应大概。ctrl + f 查找并替换全部。
填上标注文件list路径,不要带引号,再勾选左边打开webui
确认没问题关闭校对,打开第二页GPT_SoVITS-TTS
分别填上实验名,标注文件和数据集的路径,点击一键三连
完成后打开1B微调训练,调整参数分别进行SoVITS和GPT训练(这个训练比RVC快很多)
到这模型就算训练好了
推理
刷新并选择刚才训练的模型,勾选开启TTS推理WebUI
选择模型,并选择一句语音素材和对应的文本(文本可以不输入)(合成的语调和这句话有很大关系),在下面输入想输出的话,进行合成。长文本现在下面切下再在上面合成会更好(凑四句一切效果不错)
感觉这个最麻烦的就是训练模型,估计也能找到别人做好的模型,先就这样