GPT-SoVITS AI声音克隆 – 慕茸的小窝

本文最后更新于112 天前，其中的信息可能已经过时，如有错误请发送邮件到2678940862@qq.com

这个与RVC的区别在与这个是模型生成声音，RVC用于（实时）变声，声变声，模型方面似乎不能通用。

首先得收集语音素材数据集，并且制作同名.list标注文件，将标注文件放在E:\GPT-SoVITS\GPT-SoVITS-beta0706\output\asr_opt

list中语音素材的地址要改，一一对应大概。ctrl + f 查找并替换全部。

填上标注文件list路径，不要带引号，再勾选左边打开webui

确认没问题关闭校对，打开第二页GPT_SoVITS-TTS

分别填上实验名，标注文件和数据集的路径，点击一键三连

完成后打开1B微调训练，调整参数分别进行SoVITS和GPT训练（这个训练比RVC快很多）

到这模型就算训练好了

刷新并选择刚才训练的模型，勾选开启TTS推理WebUI

选择模型，并选择一句语音素材和对应的文本（文本可以不输入）（合成的语调和这句话有很大关系），在下面输入想输出的话，进行合成。长文本现在下面切下再在上面合成会更好（凑四句一切效果不错）

感觉这个最麻烦的就是训练模型，估计也能找到别人做好的模型，先就这样

发送评论编辑评论

发送评论 编辑评论