![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnL1MGNkJWZjljZlBDZ5UWO4YGO4QTYiJTOkZWM3UWZmZzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
fgo玉藻前訓練集:
wav_trans:480條
wav_val:25條
訓練效果不算很滿意,主要原因應該是訓練集數量不夠
損失函數從57k開始收斂。後面疊代到了150k次,與前面并無明顯差别。500條左右的訓練集差不多這樣就是極限了
還有一點猜測:
mooncell 玉藻前 玉藻前的語音集語調變化明顯。語氣詞、高音也較多,部分語音推測後明顯有爆音的音頻。訓練集text符号沒有完全處理?可能這類語調明顯的遊戲音頻可能還需要更多的訓練集。
fgo玉藻前訓練集:
wav_trans:480條
wav_val:25條
訓練效果不算很滿意,主要原因應該是訓練集數量不夠
損失函數從57k開始收斂。後面疊代到了150k次,與前面并無明顯差别。500條左右的訓練集差不多這樣就是極限了
還有一點猜測:
mooncell 玉藻前 玉藻前的語音集語調變化明顯。語氣詞、高音也較多,部分語音推測後明顯有爆音的音頻。訓練集text符号沒有完全處理?可能這類語調明顯的遊戲音頻可能還需要更多的訓練集。