999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

同電腦對話

2009-01-01 00:00:00
世界博覽·海外卷 2009年4期

40年前,一部驚世駭俗的科幻巨作被搬上銀幕,那就是斯坦利·庫布里克執導的《2001漫游太空》。片中那個平靜冷酷而無所不知的超級電腦——哈爾9000型,給大家留下了深刻的印象。這臺超級電腦不但完全采用語音控制,而且能思考,還能和人對話。自那一刻起,能與電腦進行交談便成為了諸多電腦愛好者的夢想。

在那以后,計算機科技飛速發展,語音控制技術也取得了很大的進展,如今我們可以通過語音預定機票、銀行轉賬,還能通過語音識別功能控制我們的手機,但是,像哈爾這樣能夠交談的電腦卻依然遙不可及,穩定可靠的語音識別技術看上去也遙遙無期。2007年,美國使用互動式語音應答(IVR)系統的總時間超過了430億分鐘,但是使用者中只有不到1/10表示滿意,抱怨倒是占了九成。蘋果電腦的最新Mac操作系統為殘障人士設計了語音控制功能,但是人們卻對那難聽的語音極其反感……讓電腦說話,這個目標現在是那么的遙遠,而我們現在所做出的成績,實際上并沒有拉近我們與目標之間的距離,我們一直在原地踏步。

說和聽的基本原理

說話的過程是機械的,不難模仿,而且人們的確早在人工智能誕生之前就開始嘗試制作說話機器。18世紀末期,匈牙利發明家沃爾夫岡·馮·坎比林模擬人的聲道制作了一個說話機器,用風箱做肺,用風笛的簧當作聲帶,用鍵盤模擬“嘴”。通過按鍵,操作者可以完整地演繹多種不同語言的短語。19世紀,查爾斯·惠斯通爵士改進了坎比林的機器,并在倫敦展覽,展出時,這一設備引起了年輕的亞歷山大·貝爾極大的興趣。受到啟發的貝爾設法創造了自己的裝置,希望能夠使聾啞人能正常講話。雖然沒成功,但他的早期努力為發明電話奠定了基礎。

20世紀,研究人員創造出了電子語言機器,第一部機器被稱為Voder(語音合成器),是由著名的AT&T公司的研發部門——貝爾實驗室研發的,并在1939年的世博會上展出。語音合成器摒棄了風笛和簧的機械構造,而采用了電子合成的聲音,和坎比林的機器一樣采用人工操作鍵盤來產生單詞。在上世紀50年代,電子合成聲音成為了電影中機器人最典型的特征,后來類似的合成音效也席卷了前衛搖滾音樂界。上世紀60年代早期,貝爾實驗室為計算機編程使其唱出“雛菊,雛菊,給我你的答案”。《2001漫游太空》的編劇之一,阿瑟·克拉克在訪問實驗室時聽到了計算機的歌聲,隨后他和庫布里克將這首歌搬上了銀幕,設計成了哈爾“臨死”前最后的囈語。

聽覺比說話更加復雜,更不好模仿,因為其中涉及了信號處理,即將空氣中的聲波轉換為電子脈沖來識別聲音。至于大腦識別是通過聯想記憶還是以規則為基礎的系統識別,又或者是二者兼備,學術界依然存在爭論。

研究表明,人耳是非常精密敏感的,比如說,人們可以通過倒咖啡的聲音分辨出冷熱。耳朵對人的語音極其敏感。我們可以將一起說話的不同聲音加以區分,在嘈雜的環境和大聲的音樂中也可以敏感地捕捉到語音,還能分辨出聲音的來源,這些都是計算機做不到的。我們能聽出電話另一端的笑聲,耳朵能識別嘴唇的開合所引起的聲音變化。這也是為什么呼叫中心的員工中有一條規矩,“盡管對方看不到,我們依然要保持微笑”。

語音識別是最難的技術

最早的語音識別嘗試始于20世紀五六十年代。當時的人工智能先驅們試圖模擬人類理解語言的方式。但是從哪里開始呢?即便諸如“是”這么一個簡單的字便擁有幾十種不同的表述方式——諸如是、對、好。嗯、啊、哦、耶、沒錯、當然、肯定的、太棒了、不錯、 沒問題、說中了、說對了”等等——這里面有什么規律呢? Nuance公司的語言工程師們曾試圖預測人們可能說“是”的不同方式,但是結果大大出乎意料。比如,設計者們發現不同說話習慣的人在使用這一系統時會遇到麻煩,因為有人在表述觀點時會習慣性地綴上“先生”或者“女士”之類的稱謂,取決于應答音源的性別,但是電腦并沒有設計程序識別這一稱謂。同時,語言并不是靜止的;語言的規則在不斷演變。研究員們告訴機器當一句的結尾處聲調上升時,一般即為一個問句,但是當遇到語言學家所說的“慣用升調”的人便行不通了——有些地方的女孩子講英語的時候總是用升調的語氣,麻煩的是現在這種口音在美國各地都很流行。

在上世紀七八十年代,很多語言研究者逐漸離開了語言規律的研究,轉而用一種概率性途徑來進行語音識別。統計學“學習程式”——即基于數據流建立模塊的方法——打碎了人工智能文化前進的車輪。IBM公司的托馬斯·沃森語音研究中心的首席技術官大衛-納哈姆說:“基于概率算法的野蠻計算方式最終戰勝了基于規律的計算方式。”一個語音識別器,通過學習語句中或前后文中某關鍵詞的出現頻率,便可以學會進行一定的推測。這樣的系統不會明白每個字或詞的意思,但是只要有足夠的數據和運算能力,那么該系統就可能在特定的有限詞匯量范圍內,例如醫療轉錄一類工作上,執行高準確度的機器翻譯。

在1969年,貝爾實驗室的一名杰出成員約翰·皮爾斯給《美國聲音科學》雜志發去一封著名的信件,題目為《語音識別往何處去》,其中提出,能夠識別語音卻無法理解語音的語音識別設備,不管計算方法有多么復雜,究其實質依然不過是個現代版的“坎比林的說話機”——糊弄人的小玩意兒。但在大多數研究人員看來,狹義地講,單就語音識別領域,這樣的設備總歸聊勝于無。

197i年,美國國防部高級研究計劃局提出了一個“語音識別五年計劃”。四家機構被選為執行機構,分別為BBN公司,IBM公司,斯坦福研究所和卡內基梅隆大學。四家機構的開發目標相同,均為一個詞匯量達到1000的語音識別系統。其后,又啟動了諸多有可能運用于軍事的相關項目,其中一個項目就是手持式自動語音翻譯機,另外一個則是可以直接解讀外文媒體并翻譯成英文的軟件。

另外,還有著名的DARPA計劃,是由電話公司(主要是貝爾實驗室)和一些計算機公司(其中最著名的就是IBM公司)所主持開發的語音識別系統。計算機公司還希望能并發出基于語音的自動聽寫系統,即所謂的“圣杯項目”。但是,在現實世界中建立一個穩定可靠的語音識別系統比任何項目都要困難。直到上世紀90年代初,各電腦公司才算將類似產品投入市場,其產品還都很難像廣告里說的那樣穩定運行。這一新興產業經歷了極大的動蕩,行業領頭羊Lemout&Hauspie公司更是由于一場重大的會計丑聞而引火上身。

語音數據庫最重要

無論是研究機構還是企業,都有一個共識,語音識別研究很大程度上依賴于數據樣本的數量,或“語料庫”大小——即你所使用的語音的絕對數量。語料越多,可以輸入到學習程式的信息就越多,系統分析判斷的能力越強。IBM不但在實驗室里或通過廣播收集聲音樣本,同時還在野外進行收集。在沃森研究中心工作的安迪·亞倫,花費了大量時間錄制人們在駕駛時或坐在副駕駛位置上的語音資料,以便準確識別在汽車內人們的語言模式。他發現:“當人們在開車時,說話方式與在辦公室里完全不同。”比如,由于受所謂“鳥類適應噪音”現象的影響,我們在車內說話的聲音會比較大——人們會不自覺地加大說話音量以抵消背景中的噪音影響。亞倫的資料同時應用于語音識別器與語音合成器(即電腦所生成的語音)兩個方面。“語音識別器和語音合成器的資料收集只有一種區別,”他說,“在語音識別器上,你需要教會系統準確鑒定出未知的語言聲音。所以你需要輸入大量不同人的聲音樣本,以便讓系統可以識別出不同美國人說‘no’時的音位。而聲音合成器正好相反。你的聲頻可能都來源于精心挑選的專業播音員,可能因為你喜歡他的聲音。那么你就需要錄制同一個人的大量聲音樣本,讓其朗讀包括不同音位組合與單詞的句子。”

BBN公司進入語音識別領域是緣于其聲學工程公司的背景。該公司曾經于半個世紀前設計了林肯中心的愛樂音樂廳,并率先進入了飛機內噪音測量的研究領域,引領了飛機引擎的靜音變革。BBN用于發展語音識別系統的語音資料來自于一個共享的數據庫——語音數據聯盟。

在劍橋大學,人們展示了一臺語言引擎,籽半島電視臺現場直播轉換成基本可讀的英文文本,滯后時間僅為三分鐘。在另外一個演示中,該軟件捕捉在播客和YouTube視頻上的對話并轉換成文本,其準確性令人印象深刻——這一技術前景可觀,將來我們將可以像搜索文本一樣簡單地搜索視頻或音頻檔案。以上兩種技術均已投入商業運營,即BBN的廣播監聽系統和EveryZing公司的視頻音頻搜索引擎。

IBM公司還展示了代號為MASTOR的多語種自動語音翻譯機。一個人用英語說道:“我們來到這座城市是為了提供人道主義援助。”設備用英文重復了一遍,以確認其表述準確,然后便將這句話翻譯成阿拉伯語并大聲朗讀出來。伊拉克人用阿拉伯語做出了回應,設備再次用阿拉伯語重復一遍以確認后翻譯成英文。整個翻譯過程花去了大約五秒鐘,而這一過程完美涵蓋了最為先進的語音識別、語音合成輸出和機器翻譯等多種技術。盡管這一談話還僅僅局限于伊拉克某個檢查點的簡單對話,但是,翻譯機本身就是統計學學習程式法的一大勝利。

電腦如何識別情緒

然而上述這些程序還欠缺的,便是情緒識別。現有的技術既無法捕獲口語中的重點,韻律和聲調(即語言學家所說的韻律學),又無法辨別表述中的情緒或言外之意。迪卡爾喜歡把理智與情感分成兩塊,而用語言作為其連通的工具。但是,沒有情緒的表述,其實并不是真正的表述。無論有沒有情緒,單詞還是相同的單詞,但語言卻絕不是相同的語言。

語音識別涵蓋了多個科技領域,包括語言學、心理學、聲學、電腦技術以及工程學等。近期在討論這一技術時,最熱門的話題就是情感識別。哥倫比亞大學的計算機學教授茱莉婭·希施博格在一次韻律學研討會上發現,“大概3/4的報告都是關于情感識別的”。

S.R.I國際組織語言組的高級研究員伊麗莎白·施麗博格說:“特別是當我們帶著情感說話時,使用的詞匯同它們字面上的意義有極大的區別。”她說,如果想要更準確地識別情緒,“我們應當使用來自于報警電話或私人求助電話的數據庫。但是由于這些聲音數據均屬私有數據,我們無權使用這一類數據。”

在洛杉磯的南加州大學語言分析與解讀實驗室,負責人史林坎·納拉亞南和學員們正在研究表情和語言的關系。比如憤怒和得意兩種情緒,雖然情緒相反,但反映在語言中卻擁有類似的能量,人們用前后文以及面部表情及聲音信號來區分。由于現在的研究只針對聲音,所以至少需要辨別出如下幾方面中的至少三項,既研究聲音的質量、速率、措辭、非連貫性(如“嗯”、“啊”之類),以及音高。他們制作至少兩套不同的數據,一套用來訓練計算機,一套用來檢測計算機。

如果我們可以訓練計算機通過聲音來辨識說話人的情緒,那么同樣可以訓練計算機作出相應的回應——當計算機發現說話人表現出不安或發怒跡象時,改用比較安撫性的口吻。這一技術的應用領域可能就是電視游戲,即通過玩家聲音的緊張感來自動調節游戲的級別。“這一程序能夠從你的聲音辨別出你是否感到沮喪,進而作出反應,”納拉亞南說,這就像《2001漫游太空》中的哈爾,當哈爾發現了宇航員開始懷疑自己,決定殺死他們。當哈爾與其中一位宇航員代夫爭奪飛船控制權時,哈爾說:“代夫,從您的聲音中,我發現您非常不安,為什么不吃一顆減壓藥,稍微休息一下?”

但是,通過對電話中心的部分語音分析,我們發現很難找到可信的情緒界定要素,并且,很可能真正的情緒識別是完全超越概率算法的。在未來將有一個項目,其目的在于制造有情感反應的機器人,并將這種機器人用于照顧老人和孩子。“當然,我們距離這一目標還很遙遠,”納拉亞南說。在此之前,我們還需要和沒有情感的機器打交道。

語言識別系統制止犯罪

基于語言的測謊設備現在小有市場,并且已經逐步成為了各國警察局的通用設備。以色列公司Nemesysco目前是這一領域里規模最大的制造商。該公司采用一種被稱為“層狀聲音分析”的技術來通過130余個聲音參數分析說話人的心理狀態。由于Nemesysco公司拒絕提供其程序是基于何種源代碼,所以學術界對基于語言的測謊法始終持懷疑態度,但不管怎樣,他們還是售出了超過1000份測謊設備和軟件——每一份軟件的售價為1.45萬美元。

現階段唯一可靠性得到承認并投入使用的情緒識別系統,是聲控智能公司開發的攻擊性鑒別系統,這一系統現已在鹿特丹和阿姆斯特丹等幾個荷蘭城市,以及英國的考文垂市得到了實際應用,并正在倫敦和曼徹斯特進行測試。系統的開發人之一,彼德·范·亨格爾解釋說,這一系統脫胎于其在荷蘭的格羅寧根大學的一個項目,一個帶計算機模塊的模擬內耳裝置。“我的一個同事原本試圖用這個內耳裝置從噪音環境中自動識別對話,”他說,“我們發現這一裝置同樣可以用于分離出屬于對話的部分,留下噪音。”他們于2000年建立了聲控智能公司,最初的主要經營方向是語音噪音分離和語音自動識別,附帶對非對話聲音進行分析。在2003年,公司接到荷蘭國家鐵路公司的一個訂單,希望他們可以設計設備自動識別某幾種聲音,以鑒別出可能對火車或車站安全運營造成影響的聲音(如玻璃破碎聲、涂鴉噴漆聲以及有侵略性的語音)。這一項目最終發展成了基于識別人類的喊叫聲來識別其是否有暴力事件發生的鑒別系統:設備可以識別人類聲帶過緊時的聲音,而人們只有遭遇攻擊時才會出現這一狀態。

格羅寧根市現已在酒吧密集的幾個主要路口架設了攻擊性鑒別系統。在馬路兩旁每隔30米便安裝一個麥克風和閉路監控攝像機。這些裝置都與格羅寧根警察局的計算機相連接。當系統識別到一些符合攻擊性特征的聲音信號時,便會向警察局發送警報,警察就可以通過閉路監控器看到具體情況:如有必要,便會派遣警力到達現場。這當然還遠達不到“哈爾”的程度,但這一系統很有前途,因為它從不自作聰明。

這一技術最大的問題就在于誤報——系統可能過多地將大聲的噪音識別為攻擊性音響。但是在格羅寧根,所存在的問題卻恰恰相反。“格羅寧根是荷蘭最安全的城市,”范·亨格爾悲傷地說,“這里幾乎沒有犯罪。因而我們根本沒有足夠的攻擊性聲音樣本來完善這一系統。”

主站蜘蛛池模板: 国产成人三级| 无码电影在线观看| 九九九精品成人免费视频7| 亚洲日本在线免费观看| 久久久久久久久久国产精品| 91网址在线播放| 国产屁屁影院| 日韩欧美视频第一区在线观看| 亚洲国产中文在线二区三区免| 99免费在线观看视频| 日韩中文无码av超清| 久久96热在精品国产高清| 亚洲美女视频一区| 亚洲日本中文综合在线| 国产91九色在线播放| 国产资源免费观看| 色偷偷av男人的天堂不卡| 夜夜操国产| 日本亚洲成高清一区二区三区| 中国国产一级毛片| 亚洲人成影院午夜网站| 中文成人无码国产亚洲| 免费在线视频a| 青青青草国产| 久热99这里只有精品视频6| аv天堂最新中文在线| 国产三级国产精品国产普男人 | 色婷婷色丁香| 国产女同自拍视频| 精品视频91| 97se亚洲综合在线天天| 欧美在线精品一区二区三区| 国产91小视频| 老司机久久精品视频| 一本大道香蕉久中文在线播放| 国产精品真实对白精彩久久| 毛片基地视频| 国产精品真实对白精彩久久 | 亚洲无码高清视频在线观看| 欧美成人综合在线| 国产不卡网| 亚洲欧美国产五月天综合| 国产成人久久综合一区| 无码精油按摩潮喷在线播放 | 青青极品在线| 91伊人国产| 久久综合亚洲色一区二区三区| 成人伊人色一区二区三区| 久久久久亚洲精品无码网站| 国产精品尤物铁牛tv| 99er精品视频| 欧洲日本亚洲中文字幕| 成人噜噜噜视频在线观看| 综合天天色| 91精品啪在线观看国产| 久久中文字幕不卡一二区| 日韩欧美91| 亚洲欧美不卡视频| 国产丝袜一区二区三区视频免下载| 精品一区二区三区中文字幕| 国产丝袜丝视频在线观看| 一级一级一片免费| 手机成人午夜在线视频| 国产成人乱码一区二区三区在线| 永久免费无码成人网站| 性色生活片在线观看| 人妻丝袜无码视频| 婷婷五月在线| 91久久大香线蕉| 91啦中文字幕| 一级毛片在线播放免费观看| 四虎亚洲精品| 国产激情无码一区二区APP| 日韩午夜福利在线观看| 国产精品一区二区在线播放| 亚洲一级色| 亚洲第一视频区| 亚洲va视频| 欧美亚洲另类在线观看| 露脸真实国语乱在线观看| 亚洲欧美日韩精品专区| 亚洲精品第一页不卡|