语音合成标记语言SSML

陈雄1年前6320
1简介SSML(SpeechSynthesisMarkupLanguage)是一种基于XML的标记语言。与纯文本的合成相比,使用SSML可以充实合成的内容,为最终合成效果带来更多变化。SSM...

只需5秒音源,这个网络就能实时“克隆”你的声音

陈雄1年前6233
只需5秒音源,这个网络就能实时“克隆”你的声音
传统的自然语音合成系统在训练时需要大量的高质量样本,通常对每个说话者,都需要成百上千分钟的训练数据,这使得模型通常不具有普适性,不能大规模应用到复杂环境(有许多不同的说话者)。而这些网络都是将语音建模...