在數字時代,我們可以閉著眼睛,在車上享受一段小說的有聲朗讀;也能在陌生的城市里,讓語音導航系統輕松帶路。隨著MP3、手機、閱讀器或iPad的普及使用,輕巧的移動電子產品將逐漸取代厚重的書籍。
語音效果超越機器人聲
未來應用廣泛的語音介面,將與過去我們熟悉的有聲書概念不同,因為這些播音的內容并不是通過耗時費力的真人錄音,而是仰賴最新發展的TTS(Text To Speeh文字轉語音合成)技術,自動將文章內容轉換成合成語音。
這項國際上早已投入發展的技術,在臺灣由“工研院”領先研發,近10多年歷經了三代的技術變革。5月底宣布上市的電子書閱讀器“遠流金庸機”,便是使用了最新一代的TTS技術。讀者不僅能讀,也可以聽。對視力不好,或在運動中不便閱讀屏幕的讀者來說,TTS都是非常方便的功能。
大師霍金靠TTS發聲
這項技術雖名為合成音,但并非不自然的機器音。“工研院”郭志忠副主任表示,他們仍需找配音員錄音,來產生合成需要的聲音與音韻的統計模型和參數,因此,語音效果早就超越那種聲調僵硬的機器人聲音。研發過程中,最重要也是最困難的部分,就是必須結合分析音韻與詞語結構的語言學知識、建構音韻特性模型的統計方法,以及合成語音波形的信號處理技術,讓最后合成的閱讀聲音,不僅可以做出自然流暢的語音,還可自動判別日期、金額等特殊數字或破音字的讀法等等。
TTS能夠將電子檔的文字自動轉成語音,對視障者來說是重要且必要的功能。過去“工研院”曾與愛盲文教基金會合作,建構有聲書下載的公益平臺。除了視障者之外,車上的導航系統,及老人、兒童、語言學習者也都是TTS技術服務的廣大對象。其中最特別也最著名的例子是全身麻痹的美國物理學大師霍金,就是通過TTS技術將想表達的文字即時轉成語音發聲,與人溝通。
郭志忠認為,過去真人錄音的有聲書因制作成本高,價格貴,普及率較低。進入電子書時代后,文字都已經數字化了,TTS技術將更有機會搭配電子書而普及。亞馬遜于2009年2月發表Kindle2時,主要的新增特色就是TTS語音朗讀功能,可見這是電子書閱讀器發展的趨勢。
最大瓶頸在于授權
因為同時預見了這個趨勢,“工研院”與遠流金庸機的合作才一拍即合。但郭志忠坦言,目前電子書發展最大的瓶頸在于版權的授權與管控問題。即便是將電子書通過合成有聲播放,大部分出版社仍主張有聲書另有版權,如Kindle2朗讀功能推出后,即被出版社控告侵犯版權、觸犯重制罪,最后Kindle只好退讓,僅提供愿意授權開放的書籍使用這項功能。
不過,除了電子書外,TTS還可應用在各種移動裝置,能夠取代電腦的多媒體影音裝置,iPad就是一個標志。郭志忠樂觀地說,未來我們不再是坐在桌前、打開電腦才能上網與閱讀,我們可以在路上聽路況、在廚房里聽食譜、在參觀博物館時即時聽導覽。到那時,可以讓人在移動中使用的語音介面變得不可或缺,TTS的角色也將更加重要。