編譯 胡德良 陳天梟
1956年夏天,一群數學家和計算機科學家占用了達特茅斯學院數學系所在大樓的頂層。在大約八周的時間里,他們想象著是否存在對一個全新領域進行研究的可能性。 當時作為達特茅斯學院的一名年輕教授,約翰?麥卡錫(John McCarthy)在為研討會寫提案時創造了“人工智能”(AI)一詞。他說,研討會將要探索這樣的假設:“從原則上來講,學習的每一個方面或智能的任何其他特征都可以得到精確描述,精確到可以利用機器進行模擬的地步。”
在那次著名的會議上,研究人員大致勾勒出了我們今天所了解的人工智能。那次研討會催生了第一個研究者團體——“符號主義專家”團隊,他們的專家團隊在20世紀80年代達到了巔峰時期。會議之后的幾年里,還出現了“連接主義專家”團隊,他們在人工神經網絡領域苦苦鉆研了幾十年,直到最近才開始有了飛躍性的發展。長期以來,這兩種方法被認為是相互排斥的,研究人員對資助的競爭非常激烈,相互之間產生了敵對情緒,雙方都認為自己走在通往通用人工智能的正道上。
回顧過去,自從那次會議以來,在幾十年的時間里,我們發現:人工智能研究人員的希望經常破滅,而這些挫折對他們的影響卻微不足道。目前,人工智能正在徹底改變各個行業,而且有可能顛覆全球勞動力市場。盡管如此,許多專家也懷有疑問:當今的人工智能是否達到了極限?正如查爾斯?邱伊(Charles Choi)在《人工智能出現故障的七種方式》(Seven Revealing Ways AIs Fail)一文中所描述的那樣,當今深度學習系統的弱點日益顯著。然而,研究人員并沒有將要遭到厄運的感覺。的確,在不遠的將來,我們有可能迎來人工智能的另外一個嚴冬。但是,這可能恰恰是一個時機,最終使擁有靈感的工程師帶領我們進入機器思維的永恒之夏。
開發符號人工智能的研究人員開始明確地讓計算機去認識世界,他們開創的原則認為:知識可以由一組規則來表示,而計算機程序可以使用邏輯來操控這些知識。占主導地位的符號主義專家艾倫?紐維爾(Allen Newell)和赫伯特?西蒙(Herbert Simon)認為:如果一個符號系統有足夠多的結構化事實和前提,最終累加起來就會產生廣泛的智能。

1958年的這臺感知器被譽為“首個像人腦一樣思考的設備”,但它并沒有完全達到宣傳的效果
另一方面,連接主義專家受到了生物學的啟發,他們致力于研究“人工神經網絡”,這種網絡將會吸收信息并通過其自身弄清信息的意義。開創性的實例就是那臺感知器——康奈爾大學心理學家弗蘭克?羅森布拉特(Frank Rosenblatt)在美國海軍的資助下建造的一臺實驗性機器。該機器擁有400個光傳感器,共同充當視網膜,向大約1 000個“神經元”提供信息,由神經元對信息進行處理,然后輸出單一的結果。1958年,《紐約時報》的一篇文章引用了羅森布拉特的說法:“這臺感知器將是首個像人腦一樣思考的設備。”

羅森布拉特發明了感知器,這是首個人工神經網絡
美國和英國的政府機構樂觀開放,備受鼓舞,向投機性研究傾注了資金。1967年,麻省理工學院教授馬文?明斯基(Marvin Minsky)寫道:“不出一代人的時間,創造人工智能的問題將得到實質性解決。”然而此后不久,政府提供的資助金開始枯竭,原因是人們感到人工智能研究沒有達到其自身宣傳的那種效果。20世紀70年代,人工智能研究遭遇了第一個冬天。
然而,真正相信人工智能的人們堅持了下來。到20世紀80年代初,符號人工智能的研究人員恢復了熱情,迎來了一個全盛時期。他們的“專家系統”獲得了贊譽和資助,該系統對某一特定學科的知識進行編碼,如法律或醫學。投資機構希望,這些系統能夠迅速找到商業應用。最著名的符號人工智能風險項目始于1984年,當時研究人員道格拉斯?萊納特(Douglas Lenat)開始研究一個他稱之為“Cyc”的項目,該項目旨在將常識編碼到機器中。直到今天,萊納特及其團隊仍在繼續向Cyc本體中添加術語(事實和概念),并通過規則來解釋它們之間的關系。到2017年,該團隊擁有150萬條術語和2 450萬條規則。然而,Cyc仍然遠遠沒有達到通用智能的水平。
在20世紀80年代末,商業的寒風吹來了人工智能的第二個冬天。專家系統的市場崩潰了,因為該系統需要專門的硬件,無法與正在變得更加便宜、更為常見的臺式電腦進行競爭。到20世紀90年代,不管是從事符號人工智能研究還是從事神經網絡研究,在學術上已經不再時髦,因為這兩種策略似乎都不成功。

人工智能領域的研究開始于1956年的一次研討會(上),從左到右依次為:奧利弗?塞爾弗里奇(Oliver Selfridge)、納撒尼爾?羅切斯特(Nathaniel Rochester)、雷?索洛莫諾夫(Ray Solomonoff)、明斯基,以及研討會組織者麥卡錫和克勞德?香農(Claude Shannon)。西蒙(中)和紐維爾(下)等符號主義專家想把有關世界的規則教給人工智能
但是,取代專家系統的廉價計算機卻成為連接主義專家的福音,他們突然有了足夠的計算能力來運行具有多層人工神經元的神經網絡。這樣的系統被稱為深度神經網絡,這種神經網絡運行的方法被稱為深度學習。多倫多大學的杰弗里?辛頓(Geoffrey Hinton)應用了一個叫作反向傳播的原理,使神經網絡通過自身犯下的錯誤進行學習。
楊立昆(Yann LeCun)是辛頓手下的一位博士后研究人員,他于1988年進入美國電話電報公司(AT&T)的貝爾實驗室。在那里,楊立昆和一位名叫約書亞?本吉奧(Yoshua Bengio)的博士后研究人員將神經網絡用于光學字符識別,美國各大銀行很快就采用這種技術來處理支票。最終,辛頓、楊立昆和本吉奧獲得了2019年度的圖靈獎,他們有時被譽為深度學習之父。
然而,神經網絡的倡導者仍有一個難題:他們擁有一個理論框架,也有不斷加強的計算能力,可是世界上卻沒有足夠的數字數據用來訓練他們的系統,至少對大多數應用來說,情況就是這樣。人工智能的春天還沒有到來。
在過去的20年,一切都發生了變化。特別是萬維網發展起來了,突然間到處都是數據。數碼相機和隨后的智能手機使互聯網上充滿了圖像,維基百科和紅迪網(Reddit)等網站充滿了可自由訪問的數字文本,YouTube網站上有大量的視頻。最后,終于有足夠的數據來訓練神經網絡,為其廣泛應用提供了條件。

1967年,麻省理工學院教授明斯基預言:真正的人工智能將在一代人的時間內創造出來
另一次重大發展來自游戲行業。英偉達等公司開發了名為“圖形處理單元”(GPU)的芯片,用于視頻游戲中渲染圖像所需的重度處理。游戲開發者使用GPU來進行復雜的著色和幾何圖形變換。需要嚴格計算能力的計算機科學家意識到:他們基本上可以欺騙GPU讓其完成其他任務,如訓練神經網絡。英偉達公司注意到這一趨勢,并創建了CUDA,這是一個使研究人員能夠利用GPU進行普通處理的平臺。在這些研究人員中有一名辛頓實驗室的博士生,名叫亞歷克斯?克里切夫斯基(Alex Krizhevsky),他利用CUDA為一個神經網絡編寫了代碼,2012年這件事情讓所有人大吃一驚。
這是克里切夫斯基為圖像網(ImageNet)競賽而編寫的代碼,該競賽要求人工智能研究人員建立計算機視覺系統,能夠將100多萬張圖像分為1 000個目標類別。克里切夫斯基的AlexNet網絡并不是第一個用于圖像識別的神經網絡,但是該網絡在2012年比賽中的表現引起了全世界的關注。AlexNet網絡的錯誤率為15%,而名列第二的入圍網絡錯誤率為26%。AlexNet網絡的完勝歸功于GPU的處理能力和包含65萬個神經元的多層“深度”結構。在圖像網第二年的比賽中,幾乎所有參賽者都使用了神經網絡。到2017年,許多參賽者的錯誤率已經降到5%,組織機構終止了比賽。
深度學習突飛猛進。有了GPU的計算能力和大量的數字數據來訓練深度學習系統,自動駕駛汽車可以進行路線導航,語音助手可以識別用戶的話語,網絡瀏覽器可以在幾十種語言之間進行互譯。此外,在包括古老圍棋和《星際爭霸II》在內的一些游戲中,人工智能還戰勝了人類冠軍,這些在以前都被認為是不可能的事情。目前人工智能的蓬勃發展已經觸及每個行業,提供了新的方法,可用于識別各種模式和做出復雜決定。
回顧幾十年來,人工智能研究人員的希望經常破滅,而遭遇的挫折并沒有阻止他們前進的腳步。
深度學習領域獲得了越來越多的成功,而這些都依賴于增加神經網絡的層數和增加專門用于訓練網絡的GPU時間。人工智能研究企業OpenAI公司的一項分析表明:2012年之前,訓練最大的人工智能系統所需的計算能力每兩年翻一番,在那之后每3.4個月翻一番。正如尼爾?湯普森(Neil C. Thompson)及其同事在《深度學習,收益遞減》(Deep Learning's Diminishing Returns)一文中寫道:許多研究人員擔心,人工智能的計算需求正處于一個不可持續的軌道上。為了避免擾亂世界上的能源預算,研究人員需要擺脫構建這些系統的既定方式。
看起來神經網絡的陣營似乎已經明確擊敗了符號主義陣營,然而事實上,這場爭斗的結果并沒有那么簡單。以OpenAI公司的機器人手為例,它操縱和解決魔方的技巧成為頭條新聞。這臺機器人使用了神經網絡和符號人工智能,是許多新的神經和符號聯合系統之一,這種聯合系統可以利用神經網絡進行感知,利用符號人工智能進行推理,這種混合方法在效率和可解釋性方面都會帶來好處。

無論是萊納特(左上)研究的Cyc等符號人工智能項目,還是由辛頓(左下)、楊立昆(右上)和本吉奧(右下)開創的深度學習所獲得的進展,都尚未產生人類水平的智力
深度學習系統往往是一個黑盒子,以不透明的神秘方式進行推斷。但是,神經符號系統使用戶能夠找到背后的原理,使他們了解人工智能是如何得出結論的。正如埃文?阿克曼(Evan Ackerman)在《美國陸軍如何將機器人打造成團隊成員》(How the U.S. Army Is Turning Robots Into Team Players)一文中描述的那樣:美國陸軍對依賴黑盒子系統特別警惕。因此,陸軍研究人員正在研究各種混合方法來驅動他們的機器人和自動駕駛車輛。
想象一下,如果你能拿到美國陸軍的一個道路清掃機器人,要求它為你沏一杯咖啡。從當今來講,這是一個可笑的要求,因為深度學習系統是為單一目的而打造的,不能將其能力從一項任務推廣到另一項任務。更重要的是,學習一項新任務,通常需要人工智能抹去自身解決先前任務時所有的相關認識,這一難題被稱為災難性遺忘。在深度思維(DeepMind)實驗室——谷歌公司位于倫敦的人工智能實驗室,著名的機器人專家拉亞?哈塞爾(Raia Hadsell)正在利用各種復雜技術來解決這個問題。在《深度思維實驗室重塑機器人的方式》(How DeepMind Is Reinventing the Robot)一文中,湯姆?奇弗斯(Tom Chivers)解釋了其中的原因,說明了對于在不可預測的現實世界中采取行動的機器人來說,這個問題非常重要。其他研究人員正在研究新型的元學習,希望創造出能夠學會如何學習的人工智能系統,然后將這種技能應用于所有的領域或一切任務。
所有這些策略可能有助于研究人員去嘗試實現他們最遠大的目標:創建擁有流體智力的人工智能,就像我們看著自己孩子在發育過程中所產生的那種智力。幼兒不需要大量的數據來得出結論,他們只是觀察世界,創建一個關于世界如何運作的心理模型,然后采取行動,并利用自己行動的結果來調整這個心理模型,這個過程不斷迭代,直到理解為止。然而,這個過程非常高效,遠遠超出了當今最先進的人工智能的能力。
目前,高漲的熱情使人工智能擁有了自身獨有的高德納技術成熟度曲線,對人工智能的資助也已經達到了歷史最高水平,況且很少有證據表明人工智能的未來會一片渺茫。世界各地的公司都在采用人工智能系統,因為這些公司看到人工智能直接提高了公司收益,它們再也不會走回頭路了。然而,研究人員是否會找到調整深度學習的方法,使其更加靈活、更加強大?或者,他們是否能夠設計出在65年的探索中連做夢都沒有想到的新方法,使機器的思維更像我們人類?讓我們拭目以待吧!
資料來源 IEEE Spectrum