Skip to content

Latest commit

 

History

History
7 lines (5 loc) · 679 Bytes

File metadata and controls

7 lines (5 loc) · 679 Bytes

SoftVC VITS Singing Voice Conversion

模型简介

歌声音色转换模型,通过SoftVC内容编码器提取源音频语音特征,与F0同时输入VITS替换原本的文本输入达到歌声转换的效果。

目前模型修使用 coarse F0 ,尝试使用HarmoF0 进行f0提取但效果不佳,尝试使用icassp2022-vocal-transcription提取midi替换f0输入但效果不佳

模型推理、训练、一键脚本汇总整理仓库 sovits_guide