莎倫·高丁

吳恩達(dá)認(rèn)為,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,但它更像是模擬人腦過(guò)程來(lái)進(jìn)行學(xué)習(xí)
下一代深度學(xué)習(xí)算法將助力搜索、物聯(lián)網(wǎng)和機(jī)器人設(shè)備。
研究人員正在竭力開(kāi)發(fā)一套新的算法,以支持更方便的搜索、自動(dòng)駕駛汽車(chē)、更靈巧的智能手機(jī)以及物聯(lián)網(wǎng)。
深度學(xué)習(xí)算法基于對(duì)大腦進(jìn)行的松散模擬,已用于推動(dòng)諸多技術(shù)的發(fā)展,比如語(yǔ)音識(shí)別、自然語(yǔ)言處理和機(jī)器人自主等技術(shù)。
現(xiàn)在,研究人員致力于研發(fā)下一代的此類(lèi)算法,下一代算法將廣泛應(yīng)用于機(jī)器學(xué)習(xí)和人工智能領(lǐng)域,有望成為重大技術(shù)發(fā)展賴(lài)以生存的基礎(chǔ)。
加布里埃爾咨詢(xún)集團(tuán)(Gabriel Consulting Group)的分析師丹·奧爾茲(Dan Olds)表示,如果我們想要看到“影響深遠(yuǎn)”的技術(shù)進(jìn)步——比如可以讓我們小睡或閱讀的自動(dòng)駕駛汽車(chē),以及會(huì)飛起來(lái)、自動(dòng)將人載往目的地的汽車(chē),就需要更好的深度學(xué)習(xí)算法。
“這些自動(dòng)駕駛汽車(chē)依賴(lài)這個(gè)本領(lǐng),即能夠‘觀察路面上的障礙,然后靈活避開(kāi)障礙。汽車(chē)辨別行人和路標(biāo)的水平越高,察覺(jué)潛在危險(xiǎn)的能力就越強(qiáng)?!眾W爾茲說(shuō),“此外,受影響的不僅僅是我們未來(lái)的數(shù)字化生活,還有我們的現(xiàn)實(shí)生活。如果我們可以把在全國(guó)或全世界運(yùn)送貨物的重任交給系統(tǒng)去處理,那會(huì)怎樣?如果我們可以在開(kāi)車(chē)去上班的路上,坐在后面睡覺(jué),又會(huì)怎樣?”
從根本上說(shuō),盡管大多數(shù)人連深度學(xué)習(xí)算法聽(tīng)都沒(méi)聽(tīng)說(shuō)過(guò),但更好的算法有望帶來(lái)這種美好的未來(lái):家居更智能化,機(jī)器人設(shè)備能夠替我們照顧父母以及遛狗。
Moor Insights & Strategy公司的分析師帕特里克·穆?tīng)柡诘拢≒atrick Moorhead)說(shuō):“這種研究意義重大,因?yàn)樗型麕?lái)更有效的方式,以便處理物聯(lián)網(wǎng)和移動(dòng)技術(shù)帶來(lái)的無(wú)限擴(kuò)展的數(shù)據(jù)集。盡管大多數(shù)人對(duì)深度學(xué)習(xí)一無(wú)所知,但它是未來(lái)數(shù)字化生活的一個(gè)重要組成部分?!?/p>
吳恩達(dá)(Andrew Ng)是斯坦福大學(xué)的計(jì)算機(jī)系副教授,也是百度公司的首席科學(xué)家。百度是一家中國(guó)互聯(lián)網(wǎng)服務(wù)公司,也是數(shù)一數(shù)二的中文搜索引擎。吳恩達(dá)正與斯坦福大學(xué)和百度的科學(xué)家進(jìn)行合作,潛心研發(fā)下一代深度學(xué)習(xí)算法。
近日,他在《麻省理工科技評(píng)論》(MIT Technology Review)雜志于馬薩諸塞州坎布里奇市舉辦的新興技術(shù)大會(huì)上作了發(fā)言,暢談深度學(xué)習(xí)技術(shù)如何應(yīng)用于搜索和未來(lái)的技術(shù)。
吳恩達(dá)擁有這方面所需的扎實(shí)背景。他曾在谷歌公司效力過(guò)一年半,一手創(chuàng)辦了谷歌的深度學(xué)習(xí)項(xiàng)目Google Brain。
除了谷歌外,微軟、Facebook和百度等公司也在致力于研發(fā)更好的深度學(xué)習(xí)算法,因?yàn)樗鼈兌加写罅康臄?shù)據(jù)需要處理。
吳恩達(dá)在接受采訪時(shí)表示,“你將數(shù)量越來(lái)越多的數(shù)據(jù)交給傳統(tǒng)算法處理時(shí),它們就開(kāi)始停頓、變慢,最終束手無(wú)策。深度學(xué)習(xí)算法卻不是這樣。這種算法的魅力在于,交給它們的數(shù)據(jù)越多,它們處理起來(lái)就越順暢?!?/p>
人腦的處理分析能力非常強(qiáng),因?yàn)榇竽X里面充斥著大量通過(guò)電脈沖進(jìn)行聯(lián)系的神經(jīng)元。基于模擬神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法正是模仿了人腦。
吳恩達(dá)解釋?zhuān)骸半S著我們建立起越來(lái)越龐大的人腦模擬體系,這些模型在消化并理解大量數(shù)據(jù)方面顯得比較高效。這些是能力非常強(qiáng)的學(xué)習(xí)算法。”
眼下,這方面的工作正在迅速開(kāi)展之中。
大概4年前,規(guī)模最大的神經(jīng)網(wǎng)絡(luò)(即深度學(xué)習(xí)算法集合)大約有1000萬(wàn)個(gè)連接節(jié)點(diǎn)。吳恩達(dá)指出,而到2011年年初,當(dāng)時(shí)他剛開(kāi)始啟動(dòng)Google Brain項(xiàng)目,那個(gè)模型里面的連接節(jié)點(diǎn)數(shù)量已激增至10億個(gè)。去年,他已與斯坦福大學(xué)的科研團(tuán)隊(duì)一起建立約有100億個(gè)連接節(jié)點(diǎn)的模型。
吳恩達(dá)的一部分工作是改進(jìn)算法,不過(guò)他及其同事還在致力于使用GPU(即圖形處理單元),而不是使用較傳統(tǒng)的CPU(即中央處理單元)。事實(shí)證明,專(zhuān)門(mén)為處理計(jì)算機(jī)圖形而設(shè)計(jì)的芯片用來(lái)構(gòu)建大型神經(jīng)網(wǎng)絡(luò)的效果好得多,因?yàn)樗鼈兏朴谔幚磉@類(lèi)運(yùn)算。
吳恩達(dá)說(shuō):“我們正在搭建使用GPU硬件的新型深度學(xué)習(xí)平臺(tái),有助于提高可擴(kuò)展性。我和合作伙伴是最早大規(guī)模開(kāi)展這項(xiàng)工作的。其他公司也在開(kāi)始亦步亦趨;不過(guò)據(jù)我所知,百度是第一家針對(duì)深度學(xué)習(xí)構(gòu)建大規(guī)模GPU集群的公司?!?/p>
讓這些算法擁有更強(qiáng)大的能力,意味著語(yǔ)音識(shí)別和可視化搜索方面將獲得巨大進(jìn)展。據(jù)吳恩達(dá)稱(chēng),那將具有重大意義。
由于越來(lái)越多來(lái)自落后貧困地區(qū)的人們上網(wǎng),會(huì)有越來(lái)越多的用戶(hù)將通過(guò)語(yǔ)音、而不是通過(guò)打字來(lái)進(jìn)行搜索。預(yù)計(jì)還會(huì)有越來(lái)越多的人對(duì)搜索對(duì)象拍照,而不是輸入描述內(nèi)容。
“5年內(nèi),會(huì)有一半的查詢(xún)請(qǐng)求將通過(guò)語(yǔ)音和圖片來(lái)進(jìn)行,所以我們?cè)谕@項(xiàng)技術(shù)投入巨資?!眳嵌鬟_(dá)說(shuō)。
經(jīng)過(guò)改進(jìn)的語(yǔ)音識(shí)別意味著,司機(jī)在駕駛過(guò)程中可以大聲發(fā)出指令,放在乘客座位上的手機(jī)會(huì)向朋友發(fā)送短信,表示晚點(diǎn)才到。
“全世界在向移動(dòng)邁進(jìn),我認(rèn)為沒(méi)人設(shè)計(jì)出真正適合移動(dòng)設(shè)備的用戶(hù)界面,這就是為什么在智能手機(jī)上的那些超小鍵盤(pán)上打字速度那么慢。”吳恩達(dá)說(shuō),“語(yǔ)音識(shí)別技術(shù)已大有改進(jìn),但還沒(méi)有達(dá)到我們的預(yù)期要求。等這項(xiàng)技術(shù)變得更完善后,我樂(lè)意圍繞語(yǔ)音識(shí)別,重新設(shè)計(jì)手機(jī)上的用戶(hù)界面。”
深度學(xué)習(xí)算法還可以用在我們的智能設(shè)備、智能汽車(chē)和可穿戴式設(shè)備上——通過(guò)得到大力倡導(dǎo)的物聯(lián)網(wǎng),把一切串聯(lián)起來(lái)。
吳恩達(dá)說(shuō):“我認(rèn)為,到時(shí)遙控器會(huì)從你家消失。如果你在家里,想聽(tīng)某首歌曲,用不著掏出手機(jī),給手機(jī)解鎖,再按一大堆按鈕,只要舒服地躺在沙發(fā)上,讓百度設(shè)備播放Justin Timberlake的某首歌曲。我希望在將來(lái)孫兒女會(huì)問(wèn)我:‘以前家電設(shè)備果真聽(tīng)不懂你說(shuō)的話嗎?他們會(huì)很好奇家里怎么會(huì)有五、六只遙控器?!?/p>