声音特征提取 合成 模型

2020 年,谷歌推出了 WaveNet,这是一种基于深度神经网络的模型,通过学习原始音频波形来产生高质量的语音合成。
这是一个陷阱,不要相信单个模型可以处理所有语音。
WaveNet模型复杂度高,需要大量训练数据。
不要这样做,结合声学模型和语言模型等其他技术来改善合成结果。

相关推荐