歌声音色转换模型,通过SoftVC内容编码器提取源音频语音特征,与F0同时输入VITS替换原本的文本输入达到歌声转换的效果。
目前模型修使用 coarse F0 ,尝试使用HarmoF0 进行f0提取但效果不佳,尝试使用icassp2022-vocal-transcription提取midi替换f0输入但效果不佳
模型推理、训练、一键脚本汇总整理仓库 sovits_guide
歌声音色转换模型,通过SoftVC内容编码器提取源音频语音特征,与F0同时输入VITS替换原本的文本输入达到歌声转换的效果。
目前模型修使用 coarse F0 ,尝试使用HarmoF0 进行f0提取但效果不佳,尝试使用icassp2022-vocal-transcription提取midi替换f0输入但效果不佳
模型推理、训练、一键脚本汇总整理仓库 sovits_guide