![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnL1MGNkJWZjljZlBDZ5UWO4YGO4QTYiJTOkZWM3UWZmZzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
fgo玉藻前训练集:
wav_trans:480条
wav_val:25条
训练效果不算很满意,主要原因应该是训练集数量不够
损失函数从57k开始收敛。后面迭代到了150k次,与前面并无明显差别。500条左右的训练集差不多这样就是极限了
还有一点猜测:
mooncell 玉藻前 玉藻前的语音集语调变化明显。语气词、高音也较多,部分语音推测后明显有爆音的音频。训练集text符号没有完全处理?可能这类语调明显的游戏音频可能还需要更多的训练集。
fgo玉藻前训练集:
wav_trans:480条
wav_val:25条
训练效果不算很满意,主要原因应该是训练集数量不够
损失函数从57k开始收敛。后面迭代到了150k次,与前面并无明显差别。500条左右的训练集差不多这样就是极限了
还有一点猜测:
mooncell 玉藻前 玉藻前的语音集语调变化明显。语气词、高音也较多,部分语音推测后明显有爆音的音频。训练集text符号没有完全处理?可能这类语调明显的游戏音频可能还需要更多的训练集。