楊思敏 張薇
我們熟悉酒精味的清冽刺鼻,但構成它的分子(C2H5OH)聞起來又是什么味道—或者它究竟有沒有氣味?如果不把鼻子湊到苯甲醛(C7H6O)上,你不會知道它聞起來像杏仁。僅僅在書本上看到二甲基硫醚的分子式(C2H6S),你也無法了解到它帶有大海的氣息。
但是現在,在一群志愿者和科學家的研究下,分子式的“味道”不再那么神秘莫測。
理論上,人類可以分辨出一萬億種氣味,然而從物質分子結構辨別氣味卻不是一件容易的事。一種分子的氣味可能取決于它包含的碳原子數目、它的穩定程度,以及它伸出的支鏈等。但是,這些結構究竟是如何影響或者決定它們的氣味的?大量的實驗表明,某些分子看似具有相同的化學組成,但帶給人的嗅覺體驗卻相差甚遠,往往一個原子數的改變就能帶來完全不同的氣味。
分子結構和它們產生的氣味之間的關聯吸引了無數科學家。2015年,美國IBM研究中心的研究員帕布洛·邁耶(Pablo Meyer)以及洛克菲勒大學的教授萊斯利·伏肖爾(Leslie Vosshall)和研究員安德里亞斯·凱勒(Andreas Keller)共同發起了一個眾包項目—夢想嗅覺預測挑戰(DREAM Olfaction Prediction Challenge),來自全世界的22支隊伍提出了各自的計算機學習算法,使機器能從大量氣味數據中做出有用的預測。最終,兩個來自亞利桑那州立大學和密歇根大學的算法取得優勝。
接下來,在構建數據庫的過程中,邁耶等人邀請了49名志愿者對 476個玻璃樣品瓶中的化合物的氣味進行逐一分類,如魚腥味、大蒜味或水果味等,共計19種描述項。此外,志愿者們還需要針對每種化合物氣味的濃淡以及給人的愉悅程度進行分級。同時,研究者們還收集了每種樣品分子的結構特征數據,包括原子類型、官能團種類等,每個樣品分子的結構特征都超過了4800 種。
綜合了參賽者給出的算法,最終的AI模型可以較為精準地預測一個分子的氣味強度和愉悅度,還能對之前提及的19種氣味描述項中的8種(“大蒜味”、“魚腥味”、“甜味”、“水果味”、“焦糊味”、“辣味”、“花香味”和“酸味”)進行準確的打分(由弱到強分別是0-1分)。他們把這個AI系統稱作—超級鼻子。
邁耶表示,“超級鼻子”能夠根據不同分子結構對其氣味進行一系列分析,其預測結果與實際的嗅覺感受非常相似。團隊成員很有信心:“我們幾乎可以預測任何分子的氣味指數,并以此推測出一種分子的聞起來的味道。”
人類的嗅覺是有極限的,“超級鼻子”也更接近人類直觀的嗅覺體驗。“如果我給你一種化學物質,讓你在周二聞一次,周三再聞一次,你兩次聞到的味道是不同的。‘超級鼻子和人類的固有知覺已經很接近了。”邁耶說,“除此之外,不同的個體之間也有差異。同樣一種分子,你和我可能聞出不同的氣味,所以這種算法在預測分子的平均氣味時表現出色,而預測某種特定的氣味時就不那么準確了。”
目前,還沒有一個完善的理論能在一種分子的性質和它的氣味之間建立一一映射的絕對關系,這種算法只能隱約揭示某些特征和某些性質之間的關聯:硫原子使物體較易發出燒焦味或大蒜味,大分子較易發出好聞的氣味,香草醛一類的分子聞起來較像烘焙食品等。但是,該項目已經可以幫助某些香料香精公司省去大量精力和投入。無疑,機器學習有助于處理海量數據的多變性和復雜性,更為人們探索分子結構與氣味之間的聯系提供了一個良好的開端。