
10月9日,瑞典皇家科學院宣布了2024年諾貝爾化學獎的獲獎者,該獎項由三位科學家共享。美國華盛頓大學的大衛·貝克因其在蛋白質設計領域的杰出貢獻而榮獲半數獎金;另一半獎金則由英國人工智能公司深度思維(DeepMind)的創始人丹米斯·哈薩比斯和該公司高級研究員約翰·喬普共同獲得,以表彰他們在蛋白質結構預測領域的重大突破。
蛋白質是生命的基石,也是維系生命活動的化學工具。多年來,化學家們一直渴望完全理解和掌握蛋白質的奧秘。如今,這一夢想已近在咫尺。貝克教授通過其研發的人工智能軟件創造出前所未有的蛋白質,讓這些蛋白質具備全新的功能。哈薩比斯和喬普則利用人工智能技術成功攻克了化學家們50多年來一直努力解決的難題—根據氨基酸序列預測蛋白質的三維結構。
探索和創造全新的蛋白質,必須深入理解其結構。貝克、哈薩比斯和喬普的研究歷程、原理和成果,為我們揭開了這一科學領域的新篇章。
自19世紀以來,科學家已認識到蛋白質在生命過程中扮演著關鍵角色,而其功能多樣性源于其獨特的三維結構。蛋白質通常由數十至數千個氨基酸組成,這些氨基酸鏈的折疊方式賦予蛋白質多樣化的形態和功能。
20世紀50年代,英國劍橋大學的約翰·肯德魯和馬克斯·佩魯茨利用X射線晶體學技術,成功揭示了世界上首個蛋白質的三維結構,并因此榮獲1962年的諾貝爾化學獎。隨后,美國科學家克里斯蒂安·安芬森通過化學方法使蛋白質展開后再重新折疊,發現蛋白質總能恢復到相同的結構。1961年,他得出結論:蛋白質的三維結構完全由其氨基酸序列決定,這一發現為他贏得了1972年的諾貝爾化學獎。
然而,安芬森的結論也遭遇了挑戰。1969年,美國分子生物學家利文索爾提出了著名的利文索爾悖論,指出由于蛋白質氨基酸鏈在未折疊狀態下具有極大的自由度,理論上一個僅由100個氨基酸組成的蛋白質就可能擁有至少1047種不同的三維結構。如果氨基酸鏈是隨機折疊的,找到正確結構的時間將遠超宇宙的年齡。
這一系列科學成就和理論探討,為今年諾貝爾化學獎的獲獎研究奠定了堅實的基礎。科學家沿著氨基酸鏈折疊的線索不斷探索,旨在實現僅通過已知的蛋白質氨基酸序列就能預測其三維結構的目標。如果該目標變為現實,科學家將不再依賴于復雜的X射線晶體學技術,可以大幅節省時間,并能根據已測定的蛋白質結構設計出全新的蛋白質。

為了激勵科研人員開發能夠迅速且精確地預測蛋白質結構的新方法,由美國馬里蘭大學的約翰·莫爾特領導的科學家團隊在1994年發起了蛋白質結構預測關鍵評估項目(CASP),該項目后來演變成兩年一次的CASP國際競賽。每兩年,世界各地的科學家會通過CASP國際競賽獲得一批新近解析的蛋白質的氨基酸序列,如何根據已知的氨基酸序列迅速而精確地預測蛋白質結構是該競賽中最大的挑戰。
2018年,哈薩比斯的加入為蛋白質結構預測帶來了新的希望。他不僅是國際象棋大師、神經科學專家,還是人工智能(AI)領域的先驅,曾設計出著名的人工智能模型(AI模型)—阿爾法圍棋(AlphaGo)。哈薩比斯從4歲起開始學習國際象棋,13歲時就達到了大師水平。從十幾歲開始,他踏上了程序員和游戲開發者的道路,并取得了成功。隨后,哈薩比斯開始深入研究人工智能,并涉足神經科學,利用人類對大腦的理解來開發更先進的人工神經網絡。
2010年,哈薩比斯創立了深度思維公司,專注于為棋盤游戲開發高級AI模型。2014年,該公司被美國谷歌公司收購。2016年3月,哈薩比斯帶領深度思維團隊開發的阿爾法圍棋在圍棋人機大戰中以4比1的比分戰勝了圍棋世界冠軍、職業九段棋手李世石,成為世界上首個戰勝圍棋世界冠軍的AI模型。
隨后,哈薩比斯將注意力轉到了對人類科技發展更為重要的問題上。2018年,他參加了第13屆CASP國際競賽,并帶來了新的AI模型—阿爾法折疊(AlphaFold)。此前,研究人員在該競賽中預測蛋白質結構的準確率最高只能達到40%。然而,阿爾法折疊在此次競賽中將預測的準確率提升至60%,這一成果標志著蛋白質結構預測領域的巨大突破。
雖然這是一個令人矚目的成就,但還未能令科學家完全滿意。因為只有當預測的準確率超過90%,我們才能真正理解蛋白質的精確功能和作用。當時,32歲的喬普剛剛加入哈薩比斯的團隊,不久之后,他帶來了對阿爾法折疊至關重要的改進想法。
2008年,剛取得物理學和數學學士學位的喬普曾在一家利用超級計算機模擬蛋白質結構的公司工作,這段經歷讓他意識到,物理學原理可以幫助人們解決生物醫學領域的難題。2011年,喬普帶著對蛋白質結構的濃厚興趣,投身于理論物理學博士學位的學習。面對大學里計算機資源緊張的問題,喬普研發了更簡潔、更高效的模擬蛋白質動力學的方法。2017年,在喬普剛剛完成博士學位時,得知深度思維公司已經啟動了蛋白質結構預測項目,他向該公司提交了工作申請。憑借在蛋白質結構模擬方面的豐富經驗,喬普針對阿爾法折疊提出了創造性的改進方案,從而被深度思維公司錄用。之后,他與哈薩比斯共同研發了阿爾法折疊-2。
2020年,哈薩比斯和喬普帶著阿爾法折疊-2參加了第14屆CASP國際競賽,他們展示的預測結果震驚了世界。阿爾法折疊-2預測蛋白質結構的準確率達到92.4%,這表明阿爾法折疊-2能夠迅速而精確地預測出已知的約2億種蛋白質的結構,為蛋白質結構預測領域帶來了革命性的進展。
阿爾法折疊-2在蛋白質結構預測方面的突破性進展,得益于其核心組件—一種名為“轉換器”的人工神經網絡。“轉換器”能夠以前所未有的靈活性在海量數據中精準識別模式。阿爾法折疊-2的訓練基于兩個龐大的數據集:一個是包含了實驗室解析出的所有已知蛋白質結構的數據庫;另一個是包含了所有已知蛋白質的氨基酸序列的數據庫。通過這些數據,阿爾法折疊-2能夠提煉出氨基酸之間的相互作用規律,并識別出在進化上相關的蛋白質,進而預測它們可能形成的各種結構。
如今,阿爾法折疊已經迭代到了阿爾法折疊-3,這一版本在預測蛋白質結構的速度和準確性上都有了顯著提升。同時,深度思維公司也公開了阿爾法折疊-2的代碼,只要你能連接互聯網就可以訪問和使用這一強大的工具。截至2024年10月,已有來自190個國家和地區的超過200萬人使用過阿爾法折疊-2。在過去,測定蛋白質結構通常需要耗費數年時間,如今,借助阿爾法折疊-2,這一過程僅需幾分鐘即可完成,極大地加速了生物醫學研究的進程。
大衛·貝克在哈佛大學的求學之路始于哲學和社會科學。然而,一門演化生物學課程徹底改變了他的職業軌跡。當時頗具影響力的教科書《細胞分子生物學》不僅點燃了他對細胞生物學的熱情,更進一步激發了他對蛋白質結構的深厚興趣。
1993年,貝克正式成為華盛頓大學蛋白質結構研究小組負責人,通過一系列巧妙的實驗,探索蛋白質結構的奧秘。在這一過程中,貝克意識到,僅憑人工實驗無法揭示數以億計的蛋白質結構,必須借助計算能力更強、速度更快的人工智能技術。
1998年,貝克領導的團隊開發了一款名為羅塞塔(Rosetta)的軟件,用于預測和設計蛋白質結構。該軟件能夠通過調整氨基酸序列來設計具有特定功能或特性的蛋白質,如增強蛋白質的穩定性或改變其結合親和力。
同年,貝克帶領團隊攜羅塞塔參加了CASP國際競賽,并在眾多參與者中脫穎而出,表現卓越。這一成就激發了貝克的新想法:他開始考慮反向使用羅塞塔軟件,即輸入所需的蛋白質結構,并讓軟件提供實現這一結構的氨基酸序列建議,從而創造出全新的蛋白質。這種方法顛覆了以往向羅塞塔輸入氨基酸序列以預測蛋白質結構的傳統做法。
天然蛋白質雖然種類繁多,但其數量和功能終究有限。為了拓展具有全新功能的蛋白質庫,貝克致力于從零開始設計蛋白質。貝克曾表示:“如果你想建造一架飛機,你不能從改造一只鳥開始;相反,你需要理解空氣動力學的基本原理,并基于這些原理來制造飛行器。”
貝克帶領團隊首先構思了一種全新的蛋白質結構,然后利用羅塞塔計算出能夠形成這種新結構的氨基酸序列。在研究團隊的引導下,羅塞塔搜索了包含所有已知蛋白質結構的數據庫,尋找與所需結構相似的蛋白質片段。接著,羅塞塔利用其對蛋白質結構的“深刻理解”,優化這些片段,最終創造了一個名為Top7的氨基酸序列,這是世界上第一種與所有已知蛋白質完全不同的蛋白質。
隨后,貝克團隊使用X射線晶體學技術確定了Top7的結構,證實了羅塞塔確實能夠創造全新的蛋白質。利用羅塞塔研發的Top7幾乎與貝克團隊最初設計的結構完全一致。這一成果標志著人們不再局限于模仿自然界中存在的蛋白質,而是能夠創造出具有獨特結構、自然界中不存在的蛋白質。Top7擁有93個氨基酸,是迄今為止科學家設計創造的最大的蛋白質之一。

與自然界隨機創造蛋白質不同,科學家的設計是有目的的。利用人工設計的蛋白質可以研發出特殊且有效的藥物,如能夠克服細菌耐藥性的抗生素及治療癌癥和艾滋病的藥物。此外,科學家還可以利用人工設計的蛋白質研發出能分解塑料的酶(酶也是蛋白質),且使其在分解過程中效率更高、速度更快。
無論是貝克的蛋白質設計創新,還是哈薩比斯和喬普在蛋白質結構預測領域的突破,都極大地拓展了人類對蛋白質的認知。蛋白質不僅是生命的基本物質,還扮演著激素、信號分子、抗體等角色,深入探索蛋白質的奧秘將為人類帶來更多、更大的益處。
隨著2024年諾貝爾化學獎的揭曉,我們見證了人工智能與蛋白質結構研究的交匯點,這不僅是科技進步的勝利,更是人類智慧的體現。大衛·貝克、丹米斯·哈薩比斯和約翰·喬普不僅解鎖了蛋白質的神秘結構,更開啟了生命科學新紀元的大門。他們的成就提醒我們,科學探索永無止境,每一次突破都是對生命奧秘的致敬,每一次創新都是對未來可能性的拓展。讓我們以這些科學巨匠為燈塔,繼續在未知的領域中勇敢前行、探索新知、創造奇跡。

大衛·貝克
大衛·貝克(David Baker),1962年10月6日出生于美國華盛頓州西雅圖市。他曾經在哈佛大學學習哲學和社會科學專業,后進入加利福尼亞大學伯克利分校學習,研究酵母中的蛋白質運輸,1989年獲得博士學位。他是一名生物化學家和計算生物學家,現為華盛頓大學西雅圖分校教授、蛋白質設計研究所所長。

丹米斯·哈薩比斯
丹米斯·哈薩比斯(Demis Hassabis),1976年7月27日出生于英國倫敦。1997年,他獲得劍橋大學計算機科學學士學位。由于哈薩比斯希望了解真正的大腦究竟是如何工作的,于是在2005年進入倫敦大學學院,攻讀神經科學博士學位。2010年,他在倫敦成立了深度思維公司;2014年,該公司被谷歌公司收購。

約翰·喬普
約翰·喬普(John Jumper),1985年出生于美國阿肯色州小石城。2007年,喬普獲得范德比爾特大學數學與物理學學士學位;2011年,進入芝加哥大學,攻讀理論化學,并將機器學習策略用于蛋白質動力學研究;2017年,獲得芝加哥大學理論化學博士學位,從事機器學習模擬蛋白質折疊和動力學研究;2018年,進入谷歌深度思維公司,任高級研究員。
【責任編輯】張小萌