

2024年的諾貝爾物理學(xué)獎和化學(xué)獎有一個共同的特點,都青睞人工智能(AI)。物理學(xué)獎頒給了美國新澤西州普林斯頓大學(xué)的約翰-霍普菲爾德和加拿大多倫多大學(xué)的杰弗里-辛頓,以表彰他們利用人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)機器學(xué)習(xí)的基礎(chǔ)發(fā)現(xiàn)和發(fā)明。化學(xué)獎授予3位科學(xué)家,其中一半授予美國華盛頓大學(xué)的戴維-貝克,以表彰他在蛋白質(zhì)設(shè)計方面的貢獻(xiàn);另一半則共同授予英國倫敦谷歌旗下人工智能公司“深層思維”的德米斯-哈薩比斯和約翰·江珀,以表彰他們在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的貢獻(xiàn)。
概括地講,就是霍普菲爾德模擬人腦神經(jīng)網(wǎng)絡(luò)發(fā)明了一個人工神經(jīng)網(wǎng)絡(luò),辛頓發(fā)明了人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法,貝克利用AI軟件設(shè)計出全新的蛋白質(zhì),哈薩比斯和江珀利用人工神經(jīng)網(wǎng)絡(luò)快速而準(zhǔn)確地預(yù)測蛋白質(zhì)結(jié)構(gòu)。
物理學(xué)獎頒給了AI科學(xué)家
20世紀(jì)80年代,霍普菲爾德研發(fā)了一個人工智能網(wǎng)絡(luò),它相當(dāng)于物理學(xué)中自旋系統(tǒng)中的能量,并通過查找節(jié)點之間的連接值進行訓(xùn)練,而節(jié)點就相當(dāng)于像素。當(dāng)這個網(wǎng)絡(luò)收到失真或不完整的圖像時,會有條不紊地通過節(jié)點并更新它們的值。因此,網(wǎng)絡(luò)能逐步工作以找到與它所傳送的不完美圖像最相似的已保存圖像。
辛頓則利用霍普菲爾德的網(wǎng)絡(luò)來使用物理工具,如使用玻爾茲曼機,由此可以學(xué)習(xí)識別給定數(shù)據(jù)類型中的特征元素。辛頓通過向機器提供規(guī)范示例來訓(xùn)練機器,而玻爾茲曼機可用于對圖像進行分類或創(chuàng)建訓(xùn)練它的模式類型。辛頓以這項工作為基礎(chǔ),幫助啟動了當(dāng)前機器學(xué)習(xí)突飛猛進的發(fā)展。
人工智能有三大基石,分別是數(shù)據(jù)、算力、算法。物理研究包括理論推導(dǎo)和實驗,后者也要用計算機模擬。機器學(xué)習(xí),即深度學(xué)習(xí),其實是一種算法,本質(zhì)上是數(shù)學(xué)領(lǐng)域的問題。如果數(shù)據(jù)充足,就可以搭建一個神經(jīng)網(wǎng)絡(luò),然后通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型(機器學(xué)習(xí))找到數(shù)據(jù)之間隱藏的規(guī)律。
辛頓開啟和奠定了算法基礎(chǔ),包括證明反向傳播算法、發(fā)明玻爾茲曼機、改進卷積神經(jīng)網(wǎng)絡(luò)。由于研發(fā)了深度卷積神經(jīng)網(wǎng)絡(luò),他被譽為“深度學(xué)習(xí)教父”。深度卷積神經(jīng)網(wǎng)絡(luò)直接促使了AI識圖功能的大爆發(fā),現(xiàn)在被廣泛應(yīng)用的人臉識別技術(shù)正來源于此。
同時,人們熟知的大型語言模型(LLM)就是基于大量數(shù)據(jù)進行預(yù)訓(xùn)練的超大型深度學(xué)習(xí)模型。它的底層轉(zhuǎn)換器是一組神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)由具有自注意力功能的編碼器和解碼器組成。編碼器和解碼器從一系列文本中提取含義,并理解其中的單詞和短語之間的關(guān)系,以及語法。OpenAI的GPT系列就是大語言模型的典型代表。
因此,人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)并非只用于數(shù)據(jù)處理,而是有廣泛的用途,相當(dāng)于擴大了數(shù)億人的大腦功能,可以進行歸納和推理,幫助人作出正確的決策。這也是為何2024年諾貝爾物理學(xué)獎授予這一基礎(chǔ)發(fā)現(xiàn)和發(fā)明的原因。
化學(xué)獎也和人工智能有關(guān)
在2024年諾貝爾化學(xué)獎方面,貝克研發(fā)的計算機化的方法實現(xiàn)了許多人認(rèn)為的不可能的事情——創(chuàng)造了以前不存在的蛋白質(zhì);哈薩比斯和江珀則利用人工智能成功解決了化學(xué)家50多年來一直在努力解決的問題——根據(jù)氨基酸序列預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)。
2003年,貝克成功地使用人工智能模型羅塞塔(Rosetta)設(shè)計了一種不同于任何其他蛋白質(zhì)的新蛋白質(zhì)。這個發(fā)現(xiàn)的重要意義在于:人類可以設(shè)計和創(chuàng)造蛋白質(zhì),包括無數(shù)種藥物、疫苗,以及作為納米材料和微型傳感器的蛋白質(zhì)。
哈薩比斯和江珀則專注于蛋白質(zhì)結(jié)構(gòu)的預(yù)測。在蛋白質(zhì)中,氨基酸以長鏈的形式連接在一起,這些長鏈折疊形成三維結(jié)構(gòu),這對蛋白質(zhì)的功能起決定性作用。20世紀(jì)70年代以來,研究人員一直試圖從氨基酸序列中預(yù)測蛋白質(zhì)的結(jié)構(gòu),但這似乎難于上青天。尤其是蛋白質(zhì)折疊,被視為難上加難。以前,研究人員只能用實驗方法去測定蛋白質(zhì)的三維構(gòu)型,而這需要大量的人力、物力和時間,需要復(fù)雜的儀器與專家級專業(yè)人員。然而,2000年,哈薩比斯和江珀推出了一個石破天驚的模型,它名為“阿爾法折疊-2”,對蛋白質(zhì)結(jié)構(gòu)的預(yù)測準(zhǔn)確率達(dá)到90%。
阿爾法折疊能從蛋白質(zhì)的一級結(jié)構(gòu),即氨基酸的排列序列來預(yù)測蛋白質(zhì)的二級結(jié)構(gòu),即蛋白質(zhì)分子中某一段肽鏈的局部空間結(jié)構(gòu),進而預(yù)測蛋白質(zhì)的三級結(jié)構(gòu),即在二級結(jié)構(gòu)的基礎(chǔ)上多段進一步折疊盤繞后形成的特定空間結(jié)構(gòu),以及預(yù)測蛋白質(zhì)的四級結(jié)構(gòu),即蛋白質(zhì)一蛋白質(zhì)復(fù)合形成的結(jié)構(gòu),這是更為復(fù)雜的生物大分子。有了阿爾法折疊及其開放的源代碼,研究人員可以立體和全方位地分析所有蛋白質(zhì)的結(jié)構(gòu)。
當(dāng)AI助力或者本身就融于物理學(xué)和化學(xué)之時,物理學(xué)和化學(xué)都有可能成為真正的“理綜”,未來的諾貝爾物理學(xué)獎和化學(xué)獎也有可能會融合為諾貝爾科學(xué)獎。