
借助人工智能,或許能揭開有關生命運作方式的部分奧秘。” 戴密斯·哈薩比斯(Demis Hassabis)是人工智能公司DeepMind的聯合創始人。他領銜的團隊近期解決了生物學的一大艱深問題。
比賽前的媒體造勢階段,李世石很是自信。他即將和一位特殊的選手對弈——人工智能圍棋程序AlphaGo。不過,身為人類頂尖棋手之一的李世石認為自己會輕松獲勝。“我覺得,AlphaGo的基本機制是概率計算,只不過是一臺機器而已。”李世石當時這么說。即便是在輸掉第一場比賽之后,他也認為這只是因為AlphaGo不會犯錯。接著,在第二場對局之中,這個人工智能程序下出了如今已是聲名在外的第37手。AlphaGo就像改寫了圍棋規則一樣,下出了根本不會有人類想到的一手棋。最終以1:4的總比分輸掉比賽的李世石驚呆了:“這手棋實在是太有想象力、太巧妙了。”
李世石和AlphaGo的這個五番棋比賽是人工智能發展歷程中的重要時刻,而德米斯·哈薩比斯正是推動人工智能發展的主要人物之一。2010年,他與合作者共同創建了DeepMind公司,并且開始研發比人類圍棋水平更高的人工智能。那個時候,人們普遍認為,人工智能很難精通圍棋,畢竟這項棋類運動中可能出現的變化要比宇宙中的原子總數還多。然而,AlphaGo在2016年戰勝了李世石,這也讓DeepMind——以及哈薩比斯——迅速成為全世界的焦點。1997年,IBM公司的“深藍”擊敗了國際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)。AlphaGo在2016年的這場勝利是繼深藍之后,人工智能的又一大重要時刻。
2016年之后,DeepMind——現在,哈薩比斯的這家公司已經隸屬于谷歌的母公司Alphabet了——一直在完善算法,并且把目光投向了棋類項目以外。2020年11月,DeepMind開發的新人工智能程序AlphaFold破解了預測蛋白質結構這一極為艱深的生物學問題。哈薩比斯認為,這還只是人工智能在科學領域發揮作用的開端。就此,《新科學家》(New Scientist)雜志編輯蒂莫西·雷維爾(Timothy Revell)采訪了哈薩比斯。
目前的目標是什么?
我們的愿景是解決人工智能問題。具體來說,就是從根本上認識智能,并且通過人工手段再現智能,然后再利用人工智能幫助我們認識世界,從而產生積極影響。加快科學發現的腳步就是我們希望看到的積極影響之一。
具體哪些類型的智能應該編碼在人工智能程序中,你們是怎么確定的?
神經科學給了我們很多啟示。我本人既有神經科學背景,又有計算科學背景:我本科階段學習計算機科學,博士階段則從事神經科學研究。人類大腦的能力及運作方式給了我們靈感,也讓我們確定了將神經科學同計算機科學聯系在一起的目標。
你們現在所做的項目中,最令人激動的是哪些?
DeepMind目前研究的項目有很多。首先,我們要認證那些令我們感興趣同時具有學科交叉屬性的科學問題。要想有所建樹,明確的目標和一定量的訓練數據都是必需的。另一個我們重點考慮的因素是影響力:如果我們解決了這個問題,是否就能開啟某個全新的科學分支?蛋白質折疊問題就符合我剛才所說的全部要求。除此之外,我們還關注量子化學、數學、物理學和材料科學等領域的前沿問題。
在蛋白質方面已經取得了重大成就。當初,為什么你們會選擇這個項目?
在我看來,蛋白質是一種非常精致的結構。它們就像一臺臺微型生化機器,在我們身體的各個部位轉運養分。它們是開關、是馬達、是一座座小工廠。從數學角度和計算機科學的角度來看,那種層面上的生物學開始變得有點數字化,并且幾乎就像計算機編碼一樣,確實很有意思。
目前,我們只知道大約10萬種蛋白質的結構,可是,自然界中總共有大約2億種蛋白質,這個比例實在是很小了。
如果能解決蛋白質折疊的問題,就很可能能夠加速藥物的研發過程。借助人工智能,我們或許能以比傳統實驗(這種方法速度慢、難度大,還牽扯很多人力、物力)快得多的速度揭開部分有關生命運作方式的奧秘,從而更深入地認識疾病。我認為,未來10~20年中,科學領域的一項重大轉變會是:通過這種計算機科學的方式認識越來越多的生物學內容。

蛋白質結構非常復雜,通常需要數年的實驗才能確定
人工智能可以幫助我們取得哪些傳統方法無法企及的生物學成就?
20世紀初,人類已經取得了許多相對容易的科學成就——雖說是相對容易一些,但也需要像愛因斯坦這樣的天才才能完成。如今,我們面對的是更為復雜的系統,它們本身并不是某幾條簡單的定律就能描述的。就目前的情況來說,人們普遍認為,生物學實在太過復雜,太缺少規律性,因而無法應用傳統物理學方法加以研究。不過,計算機科學和人工智能或許可以幫助我們跨過這道鴻溝。在我看來,這正是人工智能的最佳應用領域。
你可以把它看作一位隨時能為你服務的世界最佳科研助手。人工智能能夠找到合適的模式,它們可以從各種各樣的論文中找出看似不相干的信息,并發現其中的聯系。至于目標以及目標重要性的確定,則仍是人類科學家的責任。博士生現在做的很多工作都比較枯燥且缺乏創造性,如果能引入人工智能這樣的自動化系統,省掉一些這樣的苦差事,就能解放學生,讓他們有精力思考更有創新性的解決方案。
有一種批評觀點認為,像AlphaFold這樣的系統,它們可以很擅長某項任務,但做不了其他任何事情。我們是否需要從根本上重新審視人工智能,讓它們從設計上就變得更通用一些?
不,我認為不需要。不過,這個批評還是有道理的。我們之前開發過一款叫作AlphaZero的程序,它會所有一對一的棋類項目,并且可以在不做任何修改的前提下與對手對弈,但它有個缺點,就是每從事一項新項目都得從頭學習,沒有觸類旁通的能力。AlphaZero學到的東西沒法遷移。有些人會說,這也沒什么,你們有通用的算法就行了。還有些人則不會滿足于這點。
我個人認為,如果某個人工智能程序主要學習的是國際象棋,那么它對圍棋的認識至少也不能是零,肯定要有一些能夠遷移的東西。人類在這方面就做得特別好,畢竟我們顯然負擔不起每執行一個新任務就從頭學起的代價。這就叫遷移學習,并且也是人工智能目前沒有攻破的難關。遷移學習是一個非常活躍的研究領域,我個人目前也在做這方面的研究。當然,我們或許還需要更多的模塊,比如情境記憶和注意力機制。
這些新增模塊會在哪些方面起作用呢?
人類大腦似乎至少擁有兩個計算模塊。其一是大腦皮層,這個模塊學習速度比較慢,而且需要大量案例學習,但勝在穩定。另一個模塊就是海馬體,這也是我博士生階段研究的課題。海馬體是人類大腦的關鍵部件,并且擁有極快的學習能力。你是怎么記住昨天午餐吃了什么的?全靠海馬體。
于是,你或許會有這種疑問,為什么人類大腦沒有進化出一個超大的海馬體?學習速度肯定是越快越好嘛。實際上,老鼠的大腦基本上就是一個巨大的海馬體,并且,從體型大小來評判,這種動物算得上很聰明了。然而,問題在于——當然,這只是我個人的猜測——如果你只是學習速度快,那么學到新東西之后,未必能穩定把這些知識保留下來。你在學騎自行車的時候,可能要把彈鋼琴的專長給忘掉。因為你學得實在是太快了,沒法控制具體哪些知識會被覆蓋。
如果你現在正努力在已有知識結構的頂層構筑新知識體系,那么肯定不希望大腦那么不穩定。不過,另一方面,你肯定不想黃昏時分在水坑里遇到獅子兩次以上才發現這種情況真的很危險。因此,大腦皮層和海馬體這兩種系統你都需要,而且很可能還需要這兩個系統之間的某種遷移學習功能。這正是我們睡覺時大腦做的無數工作之一。
這是不是說,人工智能也需要某種形式的睡眠?
可能是這樣。我們也確實在做這方面的研究。在公司成立初期,我們曾訓練人工智能玩雅達利生產的那種電子游戲,記憶回放是人工智能能做到這點的一大關鍵原因。它不僅僅是在玩游戲,更是在把剛才完成的關鍵動作回放給自己看。不過,很明顯,你不能把這個叫作睡眠,實際上,它也不是真正的睡眠。對人工智能來說,這是一種離線模式。
假設有一個人工智能發展進度條,進度條的一端是掃地機器人,另一端是擁有人類智能的人工智能。那么,我們目前處在進度條的哪里?
大概是中間點附近的某個地方吧。不過,對于這個問題,有很多種見解。有些人認為,我們這些研究深度學習和強化學習的人走錯了路,所以未來肯定會碰壁;還有一些支持我們的人就會說,瞧,我們現在什么都有了,接下去不過是一些繼續升級換代、擴大技術規模的問題:運用更多的計算機,處理更多的數據,然后,終于有一天,我們就得到了擁有人類這個級別智能的通用人工智能。
我覺得,這兩派意見都有失偏頗。在我看來,我們目前已經開發出的人工智能,肯定是沒走錯路,并且還超級有用。不過,我不覺得我們已經擁有了一切。要想達到那個終極目標,還需要依賴其他的技術飛躍。
DeepMind公司有做過新冠病毒方面的研究嗎?
現在就指望人工智能可以為這樣的突發疫情帶來許多實質性的幫助,未免有些太早了。我希望未來再也不會出現新冠病毒這樣的疫情了,但如果不幸出現了,我希望人工智能到時能夠在應對疫情方面發揮更大的作用。
中國的研究人員很早就測繪了新冠病毒中蛋白質的基因序列。就當時的情況來說,我們也已經通過實驗知曉了其中某些蛋白質的結構,但仍然還有大概十幾種相關蛋白質的結構沒有掌握。當時,我們已經認為AlphaFold系統足夠精確,但由于它沒有經過實踐檢驗,我們也就沒有大肆宣揚AlphaFold找到的那些蛋白質結構。不過,我們同時也認為,這個人工智能程序絕對可以為科學界帶來幫助,所以立刻發表了AlphaFold研究的那些蛋白質的最佳模型。
說起人類生存威脅這個話題,我想問問,人工智能可以為氣候變化做點什么嗎?
我們為谷歌所做的最出名工作之一,就是控制數據中心的冷卻系統。每個人都會用到這些數據中心,比如你看YouTube視頻的時候。我們通過更高效地開關風扇、水泵以及數據中心內其他一切神奇設備,使得數據中心的能耗下降了30%。這對節約成本來說,顯然是一項巨大的進步,同時也實現了環境保護。
我們應該可以把同類型的優化升級措施應用到其他機構,甚至是電網上,那肯定會節約大量能源。未來,人工智能還會在材料設計、蛋白質設計這樣的領域大顯身手,幫助我們得到可以分解廢物塑料或是生產可再生生物燃料的蛋白質。
未來10年,人工智能能產生最大影響的領域是哪個?
我希望能在重大科學問題上看到數十項突破,以及由此產生的各種產品、服務與進步。如果我們沒能在10年內完成這個目標,那我應該會非常驚訝。我們希望在各種科學分支中扮演重要角色,比如可再生能源(尤其是核聚變技術)、量子化學、材料設計以及疾病療法。
DeepMind有這么多項目同時進行,你每天都是怎么安排的?
我的工作安排比較奇怪,因為我的工作和生活其實是相互交織在一起的。我每天有兩個工作時段。白天,我處理公司管理方面的事務,當然也少不了開會。到了晚上,我又開始工作。我是個夜貓子,晚上特別清醒,大概22點左右又會坐下來干活,一直干到天亮前的幾小時。這段時間,我主要用來撰寫自己的研究論文,閱讀并考察各個領域的最新思想、方法,并深入研究。晚上工作很安靜,沒人打擾,因此,我很喜歡在這段時間工作,一周七天,每晚如此。
聽起來,你睡覺時間并不多啊。要知道,無論對人,還是對人工智能來說,睡眠都很重要。
沒錯,我也知道,睡得少確實不是一件好事。我不知道自己還能維持這種工作方式幾年,所以,我盡量保證每天睡至少6小時,但有時就是做不到。周末的時候,我會睡睡懶覺,補一點睡眠。當然,規律作息肯定更好。
資料來源 New Scientist