早在70年代,美國國家安全局就已經(jīng)掌握了移動電話聲音識別術,如果當時的蘇聯(lián)領導人勃列日涅夫乘車行駛在莫斯科的某條大街上,他用移動電話跟其他人說話,國家安全局的聲音識別系統(tǒng)就會立即確認出勃列日涅夫的身份,他的談話內容就會立即被國家安全局工作人員記錄下來。五角大樓一位情報官曾表示:“這套系統(tǒng)甚至能夠分辨出是車內的勃列日涅夫還是其他人打的嗝兒。
語音識別技術主要有聲紋識別、內容識別、語種識別、語音標準識別等幾方面。語音識別過程實際上是一種認識過程。就像人們聽語音時,并不把語音和語言的語法結構、語義結構分開來,因為當語音發(fā)音模糊時人們可以用這些知識來指導對語言的理解過程,但是對機器來說,識別系統(tǒng)也要利用這些方面的知識,只是如何有效地描述這些語法和語義還有困難。
90年代初,美國電報電話公司想用計算機技術促進通訊業(yè)的發(fā)展,于是組織人馬研究出一種語音識別軟件。1992年3月,世界上第一套語音識別系統(tǒng)在美國誕生。當時這套系統(tǒng)的主要任務是代表公司向用戶詢問采用何種付款方式:諸如用信用卡還是現(xiàn)金等。
1997年,IBM推出了第一套中文語音識別系統(tǒng),讓我們看到人和機器用自然語言交流成為現(xiàn)實,為漢字輸入帶來了一股新鮮的潮流。1999年底,IBM中國公司在北京舉行了1999IBM中文語音技術大會,首次發(fā)布了其普通話版本的電話語音識別技術,讓我們看到了語音識別技術在電話系統(tǒng)中的廣泛應用前景。近些年,很多領域都已經(jīng)成為語音識別技術的應用熱點,例如電話通信服務領域(如電話轉接中心或查詢中心)、金融領域(如家庭銀行或股票信息查詢)、旅游服務領域(如飛機訂票或旅館預訂)等。
進入2000年以后,語音識別技術的發(fā)展更是突飛猛進。在IBM公司新近推出的世紀版語音識別系統(tǒng)中,我們看到用戶不僅可以利用該系統(tǒng)口述文檔、口述電子郵件、使用語言進行文檔格式編排,還能直接口述“網(wǎng)上沖浪”這樣的命令來訪問網(wǎng)頁,還可以實現(xiàn)真正的網(wǎng)上“聊天”。同時,由于這個版本的語音識別系統(tǒng)具備“文章智能分析功能”,可以主動學習用戶的語言模型、風格,從而可以實現(xiàn)完全“只動口,不動手”操作計算機、網(wǎng)絡以及其他電子設備的夢想。
語音識別中的聲紋識別技術;在軍事保密中有著重要的應用價值。據(jù)美國《華盛頓時報》披露,美國國家安全局一直將聲音識別技術當作研究重點。比如,利比亞領導人卡扎菲就是美國情報機構重點識別的對象IhrehdaxolRCCVCD1H9LnA==,現(xiàn)在,只要卡扎菲利用利比亞的通信網(wǎng)絡進行通話。聲音識別系統(tǒng)就會立即提醒工作人員:“卡扎菲正在通話,請注意。”最近,美國前情報官詹姆士·巴姆福德在其新著《秘密》一書中透露的一些內幕消息也證實了這套聲音識別系統(tǒng)的存在。書中說,美國情報部門開始聲音識別技術的研究已經(jīng)有很多年了,最近幾年,這套系統(tǒng)的功能不斷完善,可以準確地識別出具體的聲音。巴姆福德指出:“監(jiān)聽員甚至可以說出被監(jiān)聽者是否感冒了。”他還透露,國家安全局擁有大量被監(jiān)聽者的資料,有時候,監(jiān)聽員在監(jiān)聽時,旁邊就放著這些被監(jiān)聽者的照片。據(jù)報道,曾迫降在我國海南機場的美軍EP-3偵察機中就安裝了聲紋識別偵聽模塊。這一聲紋識別系統(tǒng)功能強人,只要被偵察者通過無線電進行對話,該系統(tǒng)便能查明通話者的身份,尤其是高層領導者的身份。美軍正是靠著這套功能強大的系統(tǒng),掌握了其他國家大量絕密情報。五角大樓曾專門邀請語言學家,對被偵察國家的語言進行了全面深入的研究,開發(fā)出了一套獨特的電子監(jiān)聽系統(tǒng),只要美軍截獲到對方的通話,這套系統(tǒng)能立即識別出通話者的身份,從而判斷出從中掌握到的情報的價值到底有多大。當截獲到對方通話后,監(jiān)聽系統(tǒng)能自動刪除雜音,通過與聲音數(shù)據(jù)庫相對照,準確識別出通話者身份。
另一方面,裝備指紋識別系統(tǒng),配合語音識別技術來查找國內隱藏的恐怖分子。目前,美國為每個美國人設計一張裝在計算機芯片的監(jiān)視識別卡,用于記錄居民的情況。當有人使用這種卡時,就會在機場安檢系統(tǒng)計算機里留下記錄。這些卡片可以與指紋或者在今后幾年的時間里與面部的特征協(xié)調起來,并被編成程序允許或禁止某人進入機場。在機場,使用駕駛艙門和行李箱搜索新技術,對機場休息室進行掃描,并對照數(shù)據(jù)庫中可疑的恐怖分子檢查旅客的外表形象。此外,使用一種專門照相機,可測出人體面部60~120種不同的變化,即使有人刮掉胡子或輕微整形登機,也難逃其銳利的“法眼”。再者,使用通過查驗旅客的指紋和視網(wǎng)膜技術,以便能揪出恐怖分子。由于人的視網(wǎng)膜具有同指紋一樣的特性,每個人的視網(wǎng)膜絕不相同,因而任何在冊的可疑分子都無法逃過檢查。采取護照加指紋措施,把流竄于世界各國的經(jīng)常改名換姓的恐怖分子逮住。在接受檢查時,護照與指紋同時證明持有者身份才有效。這樣,即使罪犯改頭換面也可辨認出真假。
在軍事計算機系統(tǒng)和核心要害部位的封閉管理中,應用聲紋識別技術進行身份認證,具有很高的精確度,可進一步增加系統(tǒng)的安全性。一些應用了聲紋識別技術的新型計算機安全產(chǎn)品,可以在普通的USB加密鑰匙基礎上,增加聲紋認證功能,并對計算機系統(tǒng)進行加密,保護計算機系統(tǒng)中的重要文件不被非法竊取、瀏覽、篡改、刪除或破壞。在一些軍事要地的核心部位,應用語音識別技術實施門禁管理,可以有效辨識合法進出者。保密管理系統(tǒng)根據(jù)輸入的自然語音信號,進行聲紋身份認證,并自動開啟或閉合門禁設施。
應用聲紋識別技術,可以對發(fā)出命令者進行身份確認,避免出現(xiàn)敵方利用我方信道偽裝我指揮員發(fā)出假命令,干擾我方軍事行動的情況。由于在計算機信息處理中,錄音的過程要經(jīng)過模擬到數(shù)字的信號轉換,放音的過程還要經(jīng)過數(shù)字到模擬的信號轉換,因此,即使竊密者使用錄音設備錄下合法用戶的聲音進行聲紋身份認證,經(jīng)過從模擬到數(shù)字、再從數(shù)字到模擬的兩次信號轉換,聲音頻譜會有明顯衰減和失真,這種失真很容易被認證程序分辯出來。所以,依靠錄音登錄也不能通過聲紋認證。適當調節(jié)聲紋認證嚴格程度的閾值,聲紋認證的“錯誤接受率”和“錯誤拒絕率”可以有所下