王南陽
TTS技術又稱文本-語音轉發處理技術,它是以大規模真實錄音的語音庫為基礎,增加音庫壓縮算法和聲色變換算法所形成的一項重大核心技術。TTS技術具有以下特點:1、可直接將任意文本信息轉化為語音輸出,即動態合成語音信息,實現真正意義上的實時語音播放;2、達到自然語調合成、字詞間平滑過渡、音色可調節的高音質水準。具有音色統一、語音清晰流利、自然度高的特點;3、以真實錄音的大容量語音庫為基礎,且音庫大小可調節,一次性語音錄入永久享用。當信息內容變動時,無需重新錄音,只要更改相應的文本信息即可。這樣既節省人工成本,又省卻錄制時間;4、非常適合信息量異常龐大的海量查詢以及查詢內容經常變化的動態查詢服務系統,如傳呼服務/故障服務/秘書服務/多媒體綜合信息服務系統;5、可廣泛應用于計算機和通訊等許多領域,如呼叫中心、電子商務、自動錄音系統、自動語音信箱、綜合語音數據服務系統、自然語音識別系統、有線/無線計費系統等。
下面以XFTS721為例,介紹嵌入式文本轉發語音處理電路的原理以及應用。XFTS721是高質量、高度集成的文本-語音轉發芯片,它是一種能把ASCII文本轉化為自然人聲音的大規模文本轉發語音處理器,可廣泛應用于車載信息終端音像播報播放、智能儀表儀器、高檔益智玩具、自動語音售貨機、公交車及電梯等音響報站(層)器、自助查詢系統、短消息播放、電子地圖、電子導游、電子詞典、電子圖書、智能電教產品、海量語音考勤系統等。