Siri的問世讓Google的互聯網搜索入口備受威脅,也讓更多的開發者們看到了移動語音的應用機會。
與PC端相比,智能移動終端設備由于體積越來越小,物理鍵盤或虛擬鍵盤手動操作變得越來越不方便,特別是在駕車、走路時,更是無法完成。智能語音識別技術在移動設備上的應用,解放了人們的雙手,通過語音命令操作設備和設備上的應用,讓這些問題迎刃而解。
輸入法始終是軟件公司、互聯網終端設備廠商的必爭之地。(iPhone到現在為止仍然沒有開發中文輸入法,很多用戶甚至為了裝搜狗而越獄!)多年前,IBM的語音識別軟件在PC上就有不錯的識別率。Google在這方面也早有布局,Android系統的Voice Action就是一項偉大的語音控制技術,它提供了非常可靠的語音識別引擎,其高識別度令人稱奇。語音識別技術公司Vlingo開發的同名移動應用在各平臺上同樣表現不俗。但與過去所有的語音命令系統一樣,這些應用都要求用戶說的話具有嚴格的語法結構和格式,命令和內容有嚴格的規范,不然,系統將很難識別。所以Voice Action、Vlingo都沒有引發輸入法的革命,它們只是一個聲控命令軟件,并不足夠智能。
Siri的誕生讓語音識別的行業人士,甚至移動應用的行業人士有種醍醐灌頂的感覺。從表面來看,Siri可以通過iPhone讀短信、介紹餐廳、詢問天氣、語音設置鬧鐘等,支持自然語言輸入,可調用系統自帶的天氣預報、日程安排、搜索資料等應用。這些功能雖然Google Voice,Vlingo都能實現,但是Siri與它們有著本質的不同。Siri會結合上下文結構理解用戶發出的語音指令,無論用戶的語言邏輯、語法結構多么繁瑣混亂,Siri還會從人類語言史的角度出發,利用人工智能系統去分析,能理解許多含義模糊或引申的語義,在多數情況下可領會用戶的意思。當然Siri的知識庫還非常有限,因此其應用也還停留在演示或者找樂引發的口碑傳播上。
Siri的問世讓Google的互聯網搜索入口備受威脅,也讓更多的開發者們看到了移動語音的應用機會。在應用匯上,就有很多開發者打起了做中國安卓操作系統上Siri的主意。比較知名的一款應用是蟲洞。上傳評審時編輯就認為很有創意,后來還做了專門的推薦。蟲洞最初的產品理念是采用用戶互助和實時抓取兩種方式滿足用戶的即時需求,算是移動問答領域的原創應用,在海外找不到產品模型,也因此很難獲得國內投資者的認同。Siri的出現,讓蟲洞找到了方向,借助多年積累的用戶數據迅速推出蟲洞語音助手——問不倒,并順利獲得了融資。蟲洞的“問不倒”同樣可以用語音指令打開關閉應用匯程序、撥打電話、發送短信等,例如,對著蟲洞語音助手說“打開微博”,當你手機上同時安裝了新浪微博和騰訊微博的情況下,它甚至會讓你選擇要打開新浪微博還是騰訊微博。蟲洞還可以用各種口音與用戶對話,粵語、川話、東北味、臺灣腔……一秒鐘變身各系風情萌妹,增加了使用的趣味性。智能360-語音助手也是非常好的一款語音助手應用,可以語音聊天解悶、發送短信、打電話、設置備忘錄、鬧鐘提醒、查詢天氣、播放想要的音樂和視頻,還能下載應用,管理應用。例如,對著智能360-語音助手說“下載微博”,它調用手機瀏覽器,將頁面指向了m.baidu.com的搜索“微博”安卓應用下載列表。
以上蟲洞問不倒和智能360-語音助手都采用了科大訊飛提供的語音識別核心技術。訊飛是一家專業從事智能語言及語言技術研究的公司。早在2010年,科大訊飛就推出了語音云開放平臺,降低開發者們的進入門檻,讓開發者們能開發出人性化的交互應用,共同培養用戶的使用習慣。經過將近3年的發展,語音云已經有幾千萬級的用戶,每天的活躍用戶百萬以上,給開發者帶來了大量的用戶和流量。科大訊飛憑借強大的自主創新能力以及多年的積累,在中文智能語音識別方面,對于中國地方方言的支持要優于iPhone的Siri和Google Voice,具有很強的本地化優勢。
越來越多的應用已經開始把智能語音輸入作為一個基礎服務,應用匯上的高德導航、高德地圖、凱立德手機導航、導航犬等手機導航軟件,新浪微博、米聊等社交應用,甚至《商業價值》的iPhone客戶端都集成了訊飛語音技術。但把語音云打造成一個基礎服務,為上億人提供服務,并與開發者一起探索出一個可行的商業模式,還有很長的路要走。
由于移動智能設備手動輸入的弊端,語音識別技術在移動應用上發展必將超越PC,并將大有作為。未來我們將會看到形式更多、體驗更棒的基于語音識別技術的移動應用,這些應用將從另一個全新的角度改變我們的生活。你甚至可以在駕車的時候通過智能手機用語音指揮家里的浴缸把洗澡水放好。