她叫王笑楠,17歲讀清華,27歲擔任博士生導師,輾轉海外留學和任教之后,又回到母校清華化工系擔任副教授。
她的研究工作與近日發布的《麻省理工科技評論》2022年“全球十大突破性技術”多項內容緊密相關,包括智能化碳捕集和利用、清潔能源、人工智能數據生成、加密計算和各個前沿場景的應用等等。2021年,她曾入選由Elsevier旗下Mendeley Data發布的“2020年度科學影響力排行榜”,并受邀擔任多本國際期刊的副主編和編委,斬獲多項國際青年大獎。
2022年伊始,她和團隊開年即迎“大豐收”,一口氣在頂刊連發多篇論文。她說這是組建“智慧系統工程”團隊五年來的積累,趕在虎年開局迎來了厚積薄發。其表示:“這些工作旨在面向實際應用,將人工智能技術和行業深度結合,提供了一種新材料研發的全新范式。我們將材料研發的全生命周期大大提速,實現了從‘鳥槍法到‘地毯式搜索的轉變,由‘釣魚變為‘打漁、網魚、養魚,以科學的設計和預測指導實驗,而不是盲人摸象地試錯。”

王笑楠
以該團隊近期發表在Nature Machine Intelligence的論文為例,他們針對器件尺度,開發出一個三段式機器學習框架。
它能用于構建預測模型,可從初始納米材料設計人手,在0.5%~350%的應變范圍內自主設計傳感器的性能。借此解決了機器學習輔助的納米復合材料設計、以及軟體機器人應變傳感器領域存在的長期挑戰。另外,該工作通過混合制造方法,同時采用實驗室材料制造和虛擬數據增強計算,來解決新材料實驗數據不規范、數據量少等挑戰,在器件層面則構建出機器學習模型,以實現針對不同軟體機器應變傳感器的自動化設計。
對于上述三段式機器學習框架的能力,王笑楠表示即使在小樣本數據下,它也能在0.5%~350%的應變范圍內實現傳感器的自動化設計,最終可實現以下兩種自動化、智能化的交互設計:第一,可根據制造配方來預測傳感器的性能;第二,則可為各種軟體機器人的不同需求,推薦適合的傳感器制造配方。

結合主動學習、數據增強和優化模型的材料器件設計新范式
另外,他們利用統計分析工具,對收集到的傳感器特征數據進行分析,揭示了潛在的材料作用機制,挖掘到隱藏在數據背后的新型傳感器材料設計原則。比如,相比調整納米材料組分,調節傳感器形貌對最終傳感器的性能影響更大。另據悉,三段式機器學習框架可在數據采集率有限的器件水平上,進行雙向的自動化交互設計。
正如多篇文獻所提到的,目前機器學習面臨的一個關鍵挑戰,是開發新型機器學習工具來加速功能電子器件的開發。由于制造過程較為耗時,難以獲得高質量的數據庫。而三段式機器學習框架,帶來的優勢有三:1、支持向量機分類器;2、主動學習;3、數據增強。這也讓該團隊得以快速收集具有代表性的數據點,并利用數據增強來訓練模型,并極大地加速了應變傳感器的預測模型的構建。
王笑楠表示:“該研究的第二個創新是實現了軟體機器人傳感器的自動化設計。它的成功意味著各類軟體機器人的傳感器制造配方,可直接由預測模型推薦,無需專家參與試錯實驗。而在此前,在如此寬的應變區間設計應變傳感器是難以完成的。”
此外,通過對收集到的數據集進行統計分析和計算,王笑楠發現了制造配方和傳感器特性之間的復雜關系,這些數據驅動的關系和趨勢,被整理歸納為新的材料設計原則,并通過原位電子顯微鏡研究得到進一步驗證。其表示:“這種用機器學習工具探索新的傳感器材料設計原則的設想,也被多篇領域內很重要的文獻提及,而我們的工作首次成功實現了這種方法。”
其中,第一作者楊海濤博士和李佳禮博士共同負責軟體機器人材料實驗框架的設計以及三段式機器學習框架的構建。
針對微納尺度,王笑楠則聯合新加坡國立大學化工系賽義夫·汗教授、麻省理工學院托尼奧·布奧納西團隊,合作開發了高通量微流控反應體系。

分子尺度的深度學習加速理論計算和設計

“看”得見會“思考”的智能儀器
“我們開創性地提供了貝葉斯優化和深度神經網絡結合的兩步算法,對于此類高通量平臺不同階段的稀疏數據和海量數據實現了有效處理,加速了納米顆粒的合成研發。”王笑楠稱。
該工作發表后不久,王笑楠又在JACS發表了一篇論文,這次聚焦于分子尺度的研究。期間,該團隊和新加坡國立大學化工系劉斌院士團隊開發出具備自我學習能力的分子、材料計算體系,加速了下一代材料開發過程。雙方結合材料第一性原理計算,基于貝葉斯優化的主動學習、以及深度學習預測模型,實現了高性能光敏劑的自我改進發現系統。
其中,來自王笑楠團隊的論文第一作者李佳禮博士提供了機器學習算法與框架的設計開發,并從超過700萬個分子的設計空間中,發現了5357個潛在的高性能光敏劑,進一步合成了其中四種分子,并顯示出與商業高性能光敏劑相當或更好的性能。
王笑楠表示:“該工作突破了主動學習在基于第一原理的材料設計中的潛力,所發現的材料結構將大大促進光敏化相關應用的發展,尤其是抗癌光動力療法等核心領域。”
而她此前發表在JACS的另一論文,則針對儀器尺度做了相關研究。據悉,王笑楠和新加坡國立大學化學系呂炯教授團隊開發出一款基于先進機器視覺算法,可用于分析掃描探針顯微鏡的“一圖像一系統”深度學習框架。為證明其準確性和通用性,他們用該框架去確定由兩個具有兩種不同手性組織模式的超分子自組裝體組成的分子的手性。結果發現,該框架準確檢測了每個分子的位置,并標明了其手性,驗證了機器學習算法的巨大潛力,具備在廣泛的研究學科中自動識別復雜的掃描探針顯微鏡圖像模式的能力。
“論文還被選為2021年JACS的18篇編輯特選之一,經過全球讀者的投票,被選作了Top3讀者精選文章。我們也感到很榮幸,希望在深度學習的前沿方法和應用上有更多突破。”王笑楠補充稱。

未來智慧碳中和實驗室
據悉,這一系列工作旨在用人工智能加速新型材料的研發,是人工智能科學新興領域的一個重要分支。相較于制藥和結構生物學領域,深度學習與功能材料研發的結合起步更晚,但擁有極高的重要性。
而深度學習優異的高維復雜數據的處理能力、以及從數據中挖掘準確規律的能力,使其可以解決功能材料研究中遇到的問題。
王笑楠認為:“用深度學習加速材料研發,已成為新的范式。正因此,她和團隊展開一系列工作,并覆蓋不同尺度的新材料研發場景,比如分子尺度、微納尺度、器件尺度、平臺尺度等。”
針對不同尺度的研發場景,王笑楠團隊分別與領域內的優秀課題組交流,詳細了解不同尺度下材料研發的特點,借此深化算法構架。
例如,針對分子尺度的材料,該團隊通過第一性原理計算得到大量的模擬數據,然后通過深度學習來加速第一性原理的計算,或通過主動學習來更高效地獲取數據,以便建立合適的數據庫。
而針對微納尺度,該團隊則主要考慮搭建高通量的微流控實驗平臺,并結合高通量的表征工具來建立相關的數據庫。
針對器件尺度,由于尺度的增加會導致流程的復雜度增加,從而致使高通量數據采集過程更加困難。基于此,該團隊針對所要設計的器件材料,定制了專門的主動學習算法,并將器件性質的預測問題,拆解成多階段性的子問題來簡化預測難度,最后結合優化算法和數據增強算法,來進一步提升模型預測能力。
針對儀器和平臺尺度,由于大量的儀器使用均會涉及到圖像分析,這時王笑楠等人使用機器學習算法,來加速自動化儀器和未來智能實驗室的實現過程。

通過以上研究,該團隊已實現新材料研發效率的大幅提升,縮短了研發周期,亦降低了研發成本。
“通過將這類研發手段用于不同領域,我們有信心解決更多領域的痛點,比如設計開發先進的新能源和儲能材料、芯片材料以及碳捕集、利用與封存材料,助力國家實現清潔能源轉型,芯片自主化及碳達峰、碳中和等遠大目標。”王笑楠總結。
基于前期良好的基礎,該團隊會更加深化在各個材料尺度的機器學習框架,朝著構建未來智能實驗室這一方向而努力。目前,王笑楠正考慮將柔性機器人、自動化機器臂與高通量實驗平臺、以及更智能的算法框架進行結合,以便在不同尺度不同種類的材料尤其是碳中和相關材料應用場景下,構建全自動智能化的實驗室。(綜合整理報道)
(編輯/諾伊克)