鮑宇辰


從讀書看報到眼神控制,作為人類“心靈窗戶”的眼睛早已超脫了簡單的器官屬性。
從阿爾馬托和斯皮納發(fā)明眼鏡以來,在這700多年的光陰中,它一成不變的主導(dǎo)性功用就是矯正視力,期間還因?yàn)橥庑尾挥懬啥兂闪恕半[形”的。而當(dāng)布林戴著Google Glass站到聚光燈下的那一剎那,眼鏡突然被賦予了全新的含義——人類和電腦的溝通交流似乎一下邁進(jìn)了一個嶄新的時代。
這個酷酷的玩意兒激發(fā)了人們對未來生活的無盡遐想。那些原本停留在實(shí)驗(yàn)室和少數(shù)工業(yè)中的技術(shù),以一種近乎粗暴的方式擠在這一架小小的眼鏡中,瞬間打破了AR(Augmented Reality,增強(qiáng)實(shí)境)技術(shù)和生活之間的距離。
最近有人調(diào)侃地寫出了對4年后人們擁有“類Google Glass”設(shè)備之后的生活的暢想,比如戴上眼鏡后抬眼一看外面的天空,溫度、霧霾指數(shù)以及出行建議即刻直達(dá)眼鏡前,直接為你的出行提供專業(yè)參考意見;或者整合社交網(wǎng)絡(luò)數(shù)據(jù),一打眼就知道這個人的基本信息、喜好等等,眼球一轉(zhuǎn),社交過程已經(jīng)走過了幾個維度;地理位置信息和導(dǎo)航與眼鏡相結(jié)合后,你幾乎再也不會“迷失”了……
布林曾直白地指出:“智能手機(jī)像‘閹割品,對人類而言顯得很笨拙,人們只是一直在觸控毫無特色的玻璃?!庇醚劬匆粔K玻璃,這就是我們期待已久的在線方式嗎?顯然不是。
不必說正被熱炒的三星Galaxy SⅣ的眼球控制功能,其實(shí)來自瑞典的Tobii公司早在2001年就開始研究眼球追蹤和眼球控制技術(shù)。用了10年的時間,它們?nèi)ツ昴贸隽薚obii眼控電腦的概念式技術(shù)原型產(chǎn)品,并得到了英特爾的注資。在今年的CES上他們繼續(xù)帶來了眼球追蹤硬件設(shè)備REX,這個小家伙已經(jīng)可以實(shí)現(xiàn)利用眼球控制Windows 8操作系統(tǒng),甚至有一家名為NUIA(Natural User Inter Action)的德國公司基于REX開發(fā)了更易編寫眼球控制的軟件,現(xiàn)在已經(jīng)可以用眼睛來玩切水果了。
但視覺控制并不是這一領(lǐng)域的難題所在,難題在于如何讓計算機(jī)擁有“視覺”。在過往的算法之中,計算機(jī)之所以能夠識別圖像,是因?yàn)槿斯閳D片添加了索引標(biāo)簽,而計算機(jī)是通過標(biāo)簽來得知圖片上的內(nèi)容的。但如何讓計算機(jī)自主識別圖片的內(nèi)容一直是業(yè)界研究的重點(diǎn)方向。
作為人類感知的最主要輸入渠道,我們所接收到的信息中的90%來自于眼睛,但二元的視覺信息和一元的聲音信息比起來處理難度可是天壤之別。不過,“在圖像識別領(lǐng)域,可預(yù)期的前景非常廣闊?!卑俣榷嗝襟w事業(yè)部副總監(jiān)余凱給出了樂觀的答復(fù),“人腦在進(jìn)行圖像識別時,利用的是語義環(huán)境;而計算機(jī)不同,根據(jù)現(xiàn)有的算法它只能從像素到像素進(jìn)行識別,識別環(huán)境中的物體還是有難度的。”百度在iOS端推出的搜索客戶端已經(jīng)可以支持寵物狗的識別,只要你給狗狗拍攝一張照片,那么搜索引擎就會告訴你狗狗的品種和售價等相關(guān)信息。
而打破這一難題的核心技術(shù)也在有條不紊地開發(fā)中,那就是模擬人腦思考方式的深度學(xué)習(xí)研究。無論Google、IBM、微軟還是百度,一旦任何一家取得了突破性進(jìn)展,都將為計算機(jī)擁有視覺乃至其他感覺提供有力的技術(shù)支持。
那么如果計算機(jī)擁有了視覺會怎樣?
一旦發(fā)生了意外事故造成人員的受傷,只需拍一張傷口的照片,計算機(jī)就會分析創(chuàng)傷的類型、受損程度以及治療方案,為醫(yī)護(hù)人員提供優(yōu)質(zhì)快速的指導(dǎo)意見;
當(dāng)監(jiān)控攝像頭拍下交通事故的瞬間,計算機(jī)就可以對事故的原因進(jìn)行分析,同時第一時間進(jìn)行應(yīng)急響應(yīng)報警,確保將事故的邊際成本降至最低;
廣告公司夢寐以求的精準(zhǔn)廣告推送可以很容易地實(shí)現(xiàn),只要你公開上傳或分享照片,它們就能從中得知你的喜好,完成它們的工作。
除此之外,3D技術(shù)的蓬勃發(fā)展已讓屏幕中的世界與現(xiàn)實(shí)世界的邊界越來越模糊。裸眼3D技術(shù)無需借助眼鏡就可讓屏幕中的人物“走出”屏幕;全息3D投影更是索性徹底拋棄屏幕,讓所投射的人物與真實(shí)世界完美融合。值得一提的是,虛擬偶像初音未來是全世界第一個利用全息3D投影技術(shù)舉辦演唱會的虛擬偶像,這場演唱會有2500人前去現(xiàn)場觀看,3萬人在線付費(fèi)觀看。信息量很大了吧?這項(xiàng)技術(shù)卻離我們不太遠(yuǎn),國內(nèi)的技術(shù)宅們甚至自己動手利用簡單的材料完整再現(xiàn)了這一場音樂會。
人們一直在尋求通過互聯(lián)網(wǎng)進(jìn)行交互時的滿足感,而這種感覺更多來自于交互時是否是在和一個“人”進(jìn)行交流。著名的MIT媒體實(shí)驗(yàn)室在研究人機(jī)交互時發(fā)現(xiàn),人們更傾向于與“類人格體”的對象進(jìn)行互動,因?yàn)槿祟悓τ谧匀桓杏X的印象更為深刻。
視覺交互似乎已經(jīng)做好準(zhǔn)備來到我們身邊,即使我們還沒準(zhǔn)備好如何去接受。