

雖然蘋果給Siri打上了測試版的標簽,但讓它幫你發個郵件或找個約會的地方還是輕而易舉的。實在無聊的時候,你甚至可以跟你的新助理探討一下人生的意義。誰知道它會給你一個什么樣的答案?
在iPhone 4S誕生之前,人與機器之間的交流就像一部默片。無論借助的是鍵盤、鼠標或觸摸屏,我們總是以無言的方式向冷漠的電腦傳遞我們的喜怒哀樂。這一切,將會因為Siri的出現而改變。
Siri到底是什么呢?它是蘋果的移動操作系統iOS 5里面內置的一款虛擬個人助理軟件,通過自然語言處理技術來實現人機交互功能。這意味著,Siri既能聽懂我們說的話,也能以我們聽得懂的語言來回答。單獨拆開來看,Siri所包含的人工智能、情景感知等功能并不是什么全新的技術。但只有在Siri那里,1+1才真正大于2。對計算機研究人員來說,一臺能真正實現與人對話的設備就像是圣杯一樣,是Siri讓他們離夢想又近了一步。
2010年4月,蘋果巨額(1.5億-2.5億美元)收購Siri公司之舉讓不少人出乎意料。但在熟悉人工智能研究的人看來,蘋果其實做了一筆非常劃算的買賣。Siri技術來源于美國政府2003年投入約1.5億美元資助SRI International以及其他研究機構開展的PAL(Personal Assistant that Learns)項目。在iPhone 4S發布之后,美國白宮在一篇博文中,特意把Siri技術與Internet和GPS這些軍轉民的技術相提并論。
耗時5年的PAL項目的目標是制造新一代的智能助理,使它們能夠從經驗中學習和推理,并聽從指令完成特定的任務。在項目結束之后,SRI意識到這項技術的潛在市場價值。Siri公司被分離出來,先后兩次共融資2400萬美元對這一技術進行商業化開發。
Siri技術的核心在于:每一個Siri詢問都會引發機器學習、自然語言處理和網絡搜索等算法。當你可以在一個像iPhone這樣的移動設備上訪問這些算法,并為它們提供GPS位置和用戶喜好等情景感知信息時,你將得到一個強大的個人行動引擎,而不僅是搜索引擎。
更早一些的語音感知和人工智能技術應用,因為很多因素而失敗。硬件的運算能力不足以及缺乏一個可操作的系統模型,是其中最主要的原因。蘋果也不例外。在上世紀80年代,蘋果就設想過知識導航者(Knowledge Navigator)的概念,并拍攝了多段相關視頻,但從未能夠將其變成現實。
iPhone 的出現為Siri帶來了契機。Siri首先在iPhone 3GS上開發了獨立的Siri應用程序。Siri需要緩存數據,需要足夠的帶寬訪問大型的數據中心,還需要強大的處理器來運算海量的數據。但能夠滿足這些需求的不只有iPhone,所以Siri也在考慮開發Android平臺上的程序,直到蘋果將其收購。
從隨后的進展來看,蘋果從一開始就對如何利用Siri的技術有非常明確的想法。他們不滿足于將Siri作為一個獨立的程序,而是要把它與iOS 5整合起來,變成一個系統平臺級的應用。這種整合讓你可以僅僅通過日常語言來啟動系統程序完成設置提醒、發送短信和電子郵件、獲取天氣信息和交通指南等任務。
人與人之間的日常交流是以一種簡單流暢的問答方式來進行的,而這種交流方式一直是人機互動面臨的巨大障礙。一個再簡單的問題,也需要我們在機器上輸入特定的提問方式,經過一系列的步驟,才能獲得令人滿意的答案。我們對此習以為常,因為我們已經被機器的這種運作方式所異化。
Siri正在試圖還原我們的行為方式。要做到這一點,Siri需要實現三個技術領域的完美結合:對話式界面(Conversational Interface)、個體情景感知(Personal Context Awareness)和服務委托(Service Delegation)。換句話說,Siri要能夠明白你說的話,再結合你的個人背景進行運算,最后才能提供你所需要的信息。這個過程不僅要求移動設備有強大的運算能力處理前端任務,還需要足夠的帶寬以保證與云端服務器的數據交換。
雖然蘋果給Siri打上了測試版的標簽,但讓它幫你發個郵件或找個約會的地方還是輕而易舉的。實在無聊的時候,你甚至可以跟你的新助理探討一下人生的意義。誰知道它會給你一個什么樣的答案?
但有個問題是Siri自己無法解答的:就像最早的iPhone不能安裝第三方軟件一樣,你不能讓Siri去執行任何非iOS內置的功能。現在我們還不能指望BBC為我們讀出當天的頭條,Oplayer自動播放一段影片,Evernote記下我們的日記。在蘋果開放Siri的API之前,我們只能想象一下Siri的未來會有多么美好。