Created by: ymzlygw
比如根据Ljspeech英语数据集训练出来的waveflow-vocoder,输入英语wav的mel文件,会生成十分相似的wav。但是如果输入其他语言的mel波形,比如日语,或者中文的mel波形,则可能无法合成正常的wav,甚至只能合成噪声文件。因此需要根据特定语言训练特定的vocoder,是这样的么?