張歡
據悉,谷歌公司近期正推出一款新的AI語音合成器,用于其機器學習云工具套件。這款語音合成器是一項名為云文本到語音的服務(Cloud Text-to-Speech) ,由谷歌位于英國的AI子公司DeepMind通過WaveNet提供技術支持。
此次谷歌推出的AI語音合成器,在WaveNet的支持下借助機器學習從頭開始生成音頻,通過分析人類語音數據庫中的波形,并以每秒24000個樣本的速率重新創建這些波形,包括唇音和口音等微妙的聲音。
借助DeepMind AI技術,谷歌數據中心的電力成本降低40%,并將WaveNet直接整合到其云服務中。在2017年10月,WaveNet被整合到Google Assistant中,現在基于Cloud Text-To-Speech,可用于語言的精選。谷歌稱,這項新服務提供32種不同的語音,可以說12種語言,用戶可以自定義音調和速度等因素。