diff --git a/docs/source/tts/svs_music_score.md b/docs/source/tts/svs_music_score.md index 05645d2b2f3cf630bdb27003ee73ae1295bf3b1b..9f351c0015b6fc6fb2a4d5bed87dbe640990104a 100644 --- a/docs/source/tts/svs_music_score.md +++ b/docs/source/tts/svs_music_score.md @@ -169,6 +169,11 @@ music scores 包含:note,note_dur,is_slur + +上述实验表明通过该方法来提取 music score 是可行的,但是在应用中可以**灵活地在歌词中加"AP"(用来表示吸气声)和"SP"(用来表示停顿声)**,对应的在 **note 上加 rest**,会使得整体的歌声合成更自然。 +除此之外,还要考虑哪一个大调并且以哪一组为起始**得到的 note 在训练数据集中出现过**,如若推理时传入训练数据中没有见过的 note, 合成出来的音频可能不是我们期待的音调。 + + # 三、其他 ## 3.1 读取midi