天天看點

VITS 模型踩坑記錄

VITS 模型踩坑記錄
VITS 模型踩坑記錄
VITS 模型踩坑記錄

fgo玉藻前訓練集:

wav_trans:480條

wav_val:25條

VITS 模型踩坑記錄

訓練效果不算很滿意,主要原因應該是訓練集數量不夠

損失函數從57k開始收斂。後面疊代到了150k次,與前面并無明顯差别。500條左右的訓練集差不多這樣就是極限了

還有一點猜測:

mooncell 玉藻前 玉藻前的語音集語調變化明顯。語氣詞、高音也較多,部分語音推測後明顯有爆音的音頻。訓練集text符号沒有完全處理?可能這類語調明顯的遊戲音頻可能還需要更多的訓練集。

繼續閱讀