目前機(jī)器人做出的反應(yīng)是機(jī)械的,但應(yīng)當(dāng)有一種方式,讓機(jī)器人自行了解如何做出反應(yīng)。
烈日炎炎、酷暑難耐,就在你口干舌燥之時(shí)一杯清涼的飲料自動(dòng)出現(xiàn)在面前,這是一幅多么美好的畫面。而在不久的將來,這將會(huì)成為事實(shí)。日前,美國(guó)康奈爾大學(xué)的研究人員宣布他們新研發(fā)的機(jī)器人可以推斷下一步你想要做什么。
機(jī)器人可以攤煎餅
這個(gè)代號(hào)為PR2的可讀人思想的機(jī)器人是由Willow Garage機(jī)器人公司負(fù)責(zé)設(shè)計(jì),通過配備微軟Kinect(關(guān)鍵點(diǎn)) 3D攝像機(jī)分析預(yù)測(cè)人的動(dòng)作。
PR2 是一個(gè)機(jī)器人平臺(tái),其中數(shù)字2代表了是第二代機(jī)器人,這一機(jī)器人研發(fā)的數(shù)據(jù)基礎(chǔ)是人們?cè)诩覄?wù)勞作中的各種動(dòng)作和決定,機(jī)器人正是通過分析人們的這些動(dòng)作而判斷大家下一步的行動(dòng)。比如:午飯過后,你希望將剩下的飯菜收好放入冰箱,機(jī)器人看到你把食物放進(jìn)一個(gè)飯盒,它便會(huì)去把電冰箱門幫你打開,而這正是你本來想做的下一個(gè)動(dòng)作。機(jī)器人還可以幫你倒啤酒或者咖啡,收拾碗筷、整理房間等做各種家務(wù)小事。
從2010年開始研發(fā)的PR2機(jī)器人已經(jīng)擁有了相當(dāng)?shù)募寄堋K坏軌驇湍汩_啤酒、疊毛巾、遞飲料,還能自己開門、自己尋找充電插座。在視頻網(wǎng)站上大家可以看到PR2機(jī)器人打臺(tái)球的高超技能,多個(gè)攝像頭可以把桌上的球進(jìn)行運(yùn)算定位,然后出桿,基本上彈無虛發(fā)。今年2月27日,在德國(guó)不萊梅, PR2機(jī)器人在不萊梅大學(xué)實(shí)驗(yàn)室中成功了進(jìn)行攤煎餅的實(shí)驗(yàn)。
PR2被譽(yù)為全球第一個(gè)能夠完成一系列綜合性操作的智能機(jī)器人,其對(duì)外銷售價(jià)格為每臺(tái)40萬美元。
機(jī)器人還能聽懂你的話
這一機(jī)器人中最核心的技術(shù)是微軟的Kinect (關(guān)鍵點(diǎn))3D攝像機(jī),機(jī)器人的視覺系統(tǒng)由激光掃描和攝像機(jī)等傳感器組合而成。這種攝像機(jī)采用3D深度攝像技術(shù),就是可以捕捉到人所在的空間位置,通過芯片合成出3D深度信息的圖像。
隨后,進(jìn)行人體骨架追蹤。識(shí)別到圖像深度信息后,Kinect 3D攝像機(jī)可進(jìn)行人體骨架追蹤。它通過軟件計(jì)算出人體主要骨骼的位置,從而捕捉到人的動(dòng)作。另外,這種攝像機(jī)還具有語(yǔ)音識(shí)別技術(shù)。它可以在3米以外過濾掉背景噪音和其他不相干聲音,準(zhǔn)確地識(shí)別出操控者的語(yǔ)音。據(jù)報(bào)道,Kinect系統(tǒng)還根據(jù)不同國(guó)家不同的口音建立了“聲效模型”,用來識(shí)別不同的口語(yǔ)和語(yǔ)言。
研發(fā)這種3D攝像技術(shù)的科技人員一開始都是游戲玩家,他們的初衷是希望能讓機(jī)器“看見”,就是開發(fā)一款能通過攝像頭捕捉玩家運(yùn)動(dòng)信息的設(shè)備,并且將捕捉的信息共享給玩家和機(jī)器。而今天康奈爾大學(xué)和Willow Garage機(jī)器人公司的計(jì)劃是將這種“看見”拓展到更深層面,讓機(jī)器人能夠看到人們的想法,以方便人們的生活。
Willow Garage公司對(duì)PR2機(jī)器人的期盼是讓人們從家務(wù)中解脫出來,并能夠幫助那些有困難的人獨(dú)立生活。
尚未真正學(xué)會(huì)“讀心術(shù)”
康奈爾大學(xué)計(jì)算機(jī)學(xué)教授和PR2項(xiàng)目研究聯(lián)合帶頭人薩希納介紹到:“我們?yōu)闄C(jī)器人描繪出人類行為的各項(xiàng)動(dòng)作標(biāo)準(zhǔn)。比如喝咖啡是一個(gè)比較大的活動(dòng),但這一活動(dòng)分為很多細(xì)小的部分(需要把這些都錄入在機(jī)器人的數(shù)據(jù)中)。”
康奈爾大學(xué)的科學(xué)家聲稱機(jī)器人對(duì)人類下一秒的動(dòng)作預(yù)測(cè)準(zhǔn)確率達(dá)82%,對(duì)第三秒之后的判斷準(zhǔn)確率達(dá)71%,10秒之后的準(zhǔn)確率則為57%。
薩希納同時(shí)表示大學(xué)和研究人員下一步的目標(biāo)是提高對(duì)預(yù)測(cè)做出正確的反應(yīng)動(dòng)作。他們希望機(jī)器人能準(zhǔn)確自主做出下一步行為:“目前我們讓機(jī)器人做出的反應(yīng)是機(jī)械的,但應(yīng)當(dāng)有一種方式,讓機(jī)器人自行了解如何做出反應(yīng)。”
目前研究人員正在把這些反饋數(shù)據(jù)錄入數(shù)據(jù)庫(kù),但真正讓機(jī)器人知道下一步要做什么還有很長(zhǎng)一段路要走。
像人腦一樣獨(dú)立思考的機(jī)器人
現(xiàn)在大概有25家研究機(jī)構(gòu)在利用Willow Garage的開放平臺(tái)開發(fā)機(jī)器人應(yīng)用。包括美國(guó)加州大學(xué)伯克利分校、斯坦福大學(xué)、麻省理工學(xué)院、南加州大學(xué)和賓夕法尼亞大學(xué)等。
其他國(guó)家對(duì)“可讀人腦的機(jī)器人”、“人腦控制機(jī)器人”、“讀心術(shù)機(jī)器人”的研究也在緊鑼密鼓的進(jìn)行著。
據(jù)英國(guó)《每日郵報(bào)》報(bào)道,日本本田公司設(shè)計(jì)開發(fā)出一種新技術(shù),通過戴在大腦上的控制器識(shí)別大腦頭皮電流變化和血液的流動(dòng)信息,人們可以通過的大腦的意念來控制機(jī)器人。據(jù)報(bào)道,日本的這種新技術(shù),可以實(shí)現(xiàn)比如打開汽車車門、關(guān)閉家里的暖氣這樣簡(jiǎn)單的動(dòng)作。研究人員的美好愿望是今后人們不再需要親自動(dòng)手了,你只需坐在舒服的沙發(fā)上靜靜地想象整個(gè)動(dòng)作過程,與你的大腦相連接的機(jī)器人就能幫你完成。
與此同時(shí),美國(guó)加州大學(xué)化學(xué)教授詹姆士·吉姆茲瓦斯基證實(shí),美國(guó)國(guó)防高級(jí)研究計(jì)劃局的研究人員已經(jīng)研制了一種設(shè)備,不僅看起來像人腦,而且可以像人腦一樣獨(dú)立思考。該項(xiàng)目使得機(jī)器人無需電腦程序,即可像人類一樣開展行動(dòng),成為首個(gè)無需人類輸入數(shù)據(jù)即可自主行動(dòng)的機(jī)器人前身。