Nuance 口說有憑
自電腦問世以來,科學家們就一直致力于讓電腦能夠理解人們的講話。幾年前,除了實驗室內的演示之外,這方面還沒有什么進展。不過現在電腦的語音識別功能已經有了質的飛躍,隨著語音識別技術慢慢走向成熟,駕駛員可以“告訴”全球定位系統(GPS)他們的目的地;手機用戶不必按鍵,只需要對著手機發布命令即可;醫生可以口述患者的病歷,而旁邊的設備就能自動記錄下來,這一切通過口頭指令來控制操作的應用現在已經不僅僅出現在科幻小說中了,而是真正成為了現實。
Nuance Communication公司(以下簡稱Nuance公司)是最大的專門從事語音識別軟件銷售的公司,而目前世界上最先進的電腦語音識別軟件Naturally Speaking就出自于Nuance公司。用戶對著麥克風說話,屏幕上就會顯示出說話的內容,很容易糾正識別錯誤。這樣一來,該軟件就會逐步適應用戶的說話風格,當然用戶也相應調整了自己的說話風格,因此語音識別的正確率就會提高。
語音識別技術ASR
要想了解Nuance公司的核心技術,首先就要知道什么是語音識別技術。語音識別技術即Automatic Speech Recognition(簡稱ASR),是指將人說話的語音信號轉換為可被計算機程序所識別的信息,從而識別說話人的語音指令及文字內容的技術。用戶可以通過ASR利用口述指令來完成對服務終端的控制。語言識別軟件是利用非常復雜的統計方法將人們的講話與單詞對應起來。通過Nuance系統可以開發自然語言理解系統,它以句子為輸入,并且返回句子意義的解釋性表達。……