999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能驅動化學品創新設計的實踐與展望

2023-10-07 12:34:26吳正浩周天航藍興英徐春明
化工進展 2023年8期
關鍵詞:模型設計

吳正浩,周天航,藍興英,徐春明

(1 美國西北大學土木與環境工程系,伊利諾伊州 埃文斯頓 60208-3109;2 西交利物浦大學化學系,江蘇 蘇州 215123;3 中國石油大學(北京)碳中和未來技術學院,北京 102249;4 中國石油大學(北京)重質油國家重點實驗室,北京 102249)

當今,化學品廣泛應用于醫藥、能源、材料、食品等領域,新型高性能化學品的研究和開發引起了密切關注。但化學品的設計和制備是一個復雜過程,涉及大量高維空間的研究參數。傳統的化學品設計過程通常是通過將化學原理與工程技術相結合,基于理論與直覺來調整配方和參數以指導實驗設計,從而尋找最優方法來設計和開發高性能、高效率和環境友好的新型化學品。但這些傳統的“試錯”方法普遍受到“維度災難”的困擾,不僅需要付出極高的時間和材料成本,也難以保證在幾乎無窮的材料設計參數中尋找到最優解,更難以闡明微觀結構與關鍵性能和機制之間的關聯,極大地限制了新產品的有效開發和化學工業的科技進步。相比于實驗技術,多尺度計算機模擬技術為充分探索化學品的結構-性能關系和分子機制提供了一個高效路徑,并具有更多的“接口”與人工智能(AI)進行結合:一方面,AI 提供了將多尺度模擬結果中復雜參數空間映射到目標函數的非線性方法,保證了在化學品復雜材料結構空間中進行高效的性能(構效關系)映射的可能性;另一方面,通過將遺傳算法、主動學習和深度生成模型等機器學習算法融入化工材料設計過程,提供了根據化學品目標性能獲得相應結構參數的高效反向設計方法。

因此,將AI有效融入到多尺度模擬計算中,有望克服化學品創新設計中的瓶頸問題,是“Al for Science”這一理念的典型代表。然而,這一融合過程涉及的研究方向和內容繁多。本文作者團隊以化學品創新設計的可行性、精準和高效為目標,認為除了大家所熟知的構建精準機器學習構效預測模型,以下三個方面的AI 驅動研究應該擺在更為重要的位置(圖1):準確快速的多尺度模型;高效的材料正向、反向設計方法;基于AI特性的科學計算軟件。本文將首先從計算機模擬方法的創新出發,圍繞化學品中典型的高分子材料,例如高分子相容劑、高分子導熱材料進行討論。同時關注AI驅動化學品創新設計,強調在AI時代中,創新計算機模擬基礎設施對未來化工研究與發展的重要性。

圖1 人工智能驅動化學品創新設計的三個重要方面

1 AI輔助的多尺度模型與分析

現實中,化學品的設計需要借助表征手段分析原子和分子的相互作用關系,以闡明相關機制。但在多尺度計算模擬中,研究者首先要基于符合物理規律的相互作用關系構建準確的原子和分子模型,以進行化學品的創新設計。在化學工程系統與化學品設計中,通常涉及從材料組分的分子到反應器的工業裝置等多層次時空尺度,通過多尺度計算機模擬技術(例如,從量子化學到分子動力學再到連續介質力學),可以實現自下而上,以電子、原子等微觀粒子為基礎,重新認識和重構傳統化學化工過程。然而,經典的計算機模擬,雖然在部分領域顯示出卓越的作用,如單分子功能預測,但仍然無法有效地應用于與實際相近的真實系統,因為其所需要的計算資源隨模擬體系的增大而指數級增加。近年來,人工智能(AI)技術在自然科學、計算科學等學科中的融合發展為改進并加強多尺度模型構建和采樣速率,特別是高模擬精度及速度提供了可能(圖2)。其中,通過AI技術來幫助發展更全面準確的理論技術來確定粒子之間在各種條件下的相互作用力是改善多尺度模擬計算技術重要的方向之一,以此為新型化學品設計提供更堅實的基礎。

圖2 人工智能輔助的多尺度模型建立

1.1 全原子機器學習勢能

準確表示微觀粒子(原子)間復雜的相互作用(勢能面)對于使用分子動力學模擬預測材料性能和設計至關重要。雖然,在Born-Opperheimer約化條件約束下,可以通過量子力學計算電子云之間的相互作用力得出原子間作用力,即從頭算分子動力學(ab-initio MD)模擬。但是,ab-initio MD 所需的計算資源極為昂貴(關于粒子數指數級增長)。因此模擬的體系往往局限于10~100 原子,限制了其在化工材料領域的廣泛應用。最近,機器學習的快速發展提供了高效準確擬合高維勢能面的可能性,能夠用較低的計算成本提供實現較高的準確性。例如,Deep Potential 團隊成功地以ab-initio 的精度在分子動力學中模擬了百億原子級別的體系,展現出了機器學習勢能(machine-learning force-field,MLFF)的優勢與潛在的應用前景。

然而,MLFF 在化學化工研究中的普及仍存在挑戰。目前常規的機器學習架構主要適用于文字、圖片、視頻等一維和二維的對象,如何精確地表達三維空間中的原子,并使其符合物理定律,仍是機器學習領域的一個難題。另外,使用現有的高精度的ab-initio MD 技術來標記數據較為耗時,如何使用更少的數據訓練以獲得性能較好的MLFF是一個亟需解決的問題。為了更好地評估MLFF,找出其中對性能至關重要的特征,從而推進MLFF領域更好的發展,本文作者團隊最近參與的一項工作[1]在材料、蛋白質、小分子等多種體系上測試評估了一系列具有不同特點的MLFF,包括DeepPot、Dimnet、Schnet、Nequip等。這項工作提出了三項新的評估MLFF 的標準:①由模擬軌跡計算的觀測量;②模擬的穩定性;③ MLFF 的計算效率。與現行MLFF評估和驗證標準要求訓練模型的能量/力誤差盡量小不同,這項工作明確指出,MLFF 訓練時的能量和力誤差的數值大小并不一定與其在模擬中的實際表現有明顯關聯。因此,需要重新考慮MLFF模型的評估標準并在評估模型時綜合考慮實際模擬的觀測量、穩定性和計算速度,以確保MLFF模型的可靠性和有效性。在評估的一系列MLFF中,具有O(3)對稱性的Nequip,即在神經網絡操作中內生地嵌入了三維空間中分子的平移、旋轉、翻轉等對稱性,在各項指標和體系中的綜合表現出色。經過細致系統的分析并結合最近一項有關機器學習表達能力的研究,機器學習架構在三維空間中分子的多體效應(many-body effect)等的表達能力,特別是對于物理對稱性群(symmetry group)的考慮,是MLFF在真實模擬條件下性能的關鍵?;谶@些理解,本文作者團隊相信深入研究發展MLFF,將有助于進一步提高其在實際化學化工過程中的應用價值。

1.2 機器學習粗粒化模型

盡管相對于ab-initio 模擬方法,MLFF 全原子模型的計算速度已經提高了數倍,但是其仍受限于較小的系統尺寸和較短的模擬時長(約10nm和1ns)。為了進一步提高模擬的速度,一個廣泛使用的概念是粗粒化(coarse-graining,CG)。粗粒化CG 是多尺度模擬中最重要的概念之一,CG 模型也是化學化工領域模擬的重要的組成部分[2-3]。在CG模型中,幾個原子或者分子被劃進一個“超級”粒子,以減少所需要模擬的粒子數,從而可以在更大的時空尺度上進行分子動力學模擬,使理解和預測與實際化學化工系統更相近的尺度上的機理與過程成為可能。

然而,訓練準確的機器學習CG 模型通常需要比機器學習全原子模型更多的數據。這是由于在將聚合原子聚合為粗粒化粒子的過程中引入了額外的誤差,增大了學習的難度。因此,獲取大量高質量數據是開發可靠高效的機器學習粗粒化模型的關鍵之一。與此同時,自上而下地基于實驗數據建立準確的粗粒化模型亦是一項極有意義且頗具挑戰的工作。自動微分作為機器學習核心組成部分,最近被引入分子動力學中,以高效準確地開發勢能模型。在最近的一項工作中,本文作者團隊使用自動微分技術將整個分子動力學模擬可微分化從而使得從模擬軌跡直接對勢能函數計算梯度成為可能[4]。將可微分模擬與隨機梯度下降優化方法相結合,本文作者團隊開發出一種新的方法來優化勢能函數,展示了如何使用可微分分子動力學模擬方法,從高質量的實驗數據中自上而下地學習出液態水分子溫度可轉移的粗粒化模型。這為未來構建更可靠的通用粗?;P偷於藞詫嵉幕A。因此,將機器學習方法與以粗?;P蜑榇淼亩喑叨饶M策略有機地結合,通過引入高質量的實驗和模擬數據,可以促進化學化學品快速高效的多尺度設計與開發。

1.3 機器學習輔助模擬分析

機器學習方法不僅可以用于構建物理模型,還廣泛應用于進行模擬結果的分析。在材料研究中,構建結構與性質之間的精確關系(即構效關系)非常關鍵。機器學習因其強大的適應能力而成為構建構效關系的強有力技術。在最近的一項研究中,本文作者團隊成功運用高效的耗散粒子動力學模擬技術,預測了數百種不同接枝情況下共聚物刷的相容性。針對這些高度復雜的數據,本文作者團隊運用機器學習技術有效構建了結構和性質之間的關系,為未來高性能聚合物相容劑的開發提供了高效直接的預測模型。另外,分子動力學模擬的結果需要從非常復雜的軌跡、能量等數據中進行分析和發掘。機器學習因其強大的降維、擬合等能力,已經成為了分析分子動力學模擬數據的強有力工具。例如,本文作者團隊利用神經網絡以脂質分子原子軌跡作為輸入,準確預測在不同酒精濃度下脂質分子的構象性質[5],從而幫助判斷冠狀病毒模型細胞膜在酒精作用下的穩定性。神經網絡高效準確的預測能力,使得快速分析數成百上千個組成成分的細胞膜成為可能,為開發高效的病毒酒精消毒液提供了理論基礎。隨著機器學習在分子動力學模擬數據分析中的廣泛應用,分子模擬在實際場景中的應用將得以更快速地推進。

2 材料設計方法

眾多先進化工技術的發展是以特殊性能材料為核心。例如,膜分離技術作為支撐水資源、能源、環境、傳統產業改造等領域的戰略性高新技術,亟需新型具有高選擇透過性的高性能聚合物材料設計與制備進行支撐。然而,聚合物材料的結構設計和性能優化是一個跨越多個尺度的復雜系統,看似微小的結構變化,如在高分子鏈中增加一個支鏈或單體序列的差異,都會對性能產生巨大影響。為此,有針對性地開發高效材料設計方法成為關鍵所在。為了解決這一挑戰,本文作者團隊基于正向設計和反求設計兩種研究思路,針對聚合物材料這一典型化學品,探索構建智能研究框架,進行AI 驅動的設計和結構調控,見圖3。

圖3 人工智能輔助的材料設計方法

2.1 正向設計

隨著計算能力和基于物理模型的迅速發展,計算機模擬,特別是分子模擬技術,可以高效測試化學化工材料的性質并進行預測??偟膩碚f,與實驗相比,計算機模擬作為一種正向設計的工具,可以極大地提高材料研發和設計的效率,同時能夠降低成本。

以聚合物為例,將已有聚合物進行共混可提高聚合物材料力學性能、加工性能,降低成本,并擴大使用范圍,是實現聚合物改性和生產多功能新型聚合物材料的重要途徑之一。然而,絕大多數聚合物是不相容的,導致混合產品的機械性能差、界面張力高。研究表明,在共混物中加入與其具有相同化學組分的共聚物是實現突破原有體系熱力學極限、開發高性能聚合物的有效方法。但對于共聚物來說,微小的結構變化(如嵌段連接方式或序列的差異)都會對性能產生影響。因此,亟需開發一種能夠從繁多結構信息中解析與辨認其關鍵作用的相容性描述符,以便實現高效、合理地設計高性能相容劑的分子結構。

本文作者團隊首先通過耗散粒子動力學模擬(DPD)研究了線型嵌段共聚物在不相容聚合物相之間的相容性能[6],并以此解析了相容劑結構特性,建立了冪律擬合模型,實現了線型嵌段共聚物的相容效率隨聚合物化學、分子結構和共聚物分子數量的變化預測。基于此研究,本文作者團隊還針對由骨架和多個側鏈組成的更復雜拓撲結構的接枝共聚物[7],結合熱力學分析和界面模型計算,關聯界面張力隨接枝共聚物多樣性結構參數變化的關系,從而辨識出起主要相容作用的結構描述符,并以此為基礎開發了DPD/ML的智能研究框架,實現了在分子水平上準確預測具有多個描述符(如分子結構和化學成分)的特定接枝共聚物的相容性效率,并基于不同描述符的重要性等級,開發了ML模型的機理解釋方法。以此為基礎,本文作者團隊成功實現了高相容性共聚物的分子量、拓撲結構和序列的精準設計,開創了以功能基元-序構為核心的相容劑正向設計的普適方法,創新發展了共聚物拓撲結構解析方法,剖析了界面增容時共聚物的空間分布機制,結合熱力學剖析構建機器學習輔助的研究框架,提出了共聚物增容信息的描述符辨認方法,并以此進行高相容性共聚物的分子量、拓撲結構和序列的精準設計,從而開創了一種以功能基元-序構為核心的相容劑正向設計的普適方法。

2.2 反求設計

反求設計,即如何從復雜的材料設計參數空間中找到對應材料目標性質的參數,對實現高性能化學化學品的創新設計十分重要。以下本文作者團隊將以高性能聚合物導熱性質為實例探討如何將AI結合理論與模擬進行有效的材料反求設計。

共聚物材料的低本征導熱性會導致積熱,進而引發材料溶脹、產品性能降低。高效開發高本征導熱性共聚物材料已經成為儲能技術發展的強烈訴求和重要科學問題。本文作者團隊瞄準這一科學問題,提出從聚合物材料的單體排列具有基因特性這一特點出發,利用材料基因組策略進行聚乙烯-聚丙烯(PE-PP)高導熱性材料設計。反求設計通過對已知的多種材料中主動搜索未知的最佳材料,相比基于結構-性能關系的正向篩選設計,降低了對數據庫本身的需求,具有較好的研究前景。

本文作者團隊采用遺傳算法和分子動力學模擬的組合框架來設計PE-PP 共聚物,基于反求設計獲得具有高熱導率的特定序列共聚物:明確不同序列的PE-PP 共聚物的熱導率分布規律,首次獲得了高出常規二嵌段共聚物40%的非直覺高導熱性共聚物(non-intuitive),進一步解析解析發現體密度、鏈構象和振動狀態密度不能準確解釋導熱性變化,提出了基于分子作用力和振動函數分析方法,量化了闡明單體序列的變化和熱能傳輸效率的構效關系,提供了將MD模擬與遺傳算法相結合來設計新型材料的應用實例[8]。本文作者團隊創新發展基于材料基因組策略的高導熱性聚乙烯(PE)-聚丙烯(PP)材料的理性設計,揭示基元PE-PP序構材料中蘊含的導熱變化規律,建立了超越人工篩選可探索范圍的變革性聚合物材料反求設計方法。

3 數據管理與軟件開發

現代化的開源數據和高效便利的軟件開發是將AI 技術運用于實際的關鍵。針對化學化工領域AI驅動的創新設計,本文作者團隊將從數據管理和科學計算軟件開發兩個方面展開討論(圖4)。

圖4 網絡基礎設施:以數據驅動的材料化學信息云平臺和開發與機器學習相適應的科學計算軟件

3.1 數據管理的云平臺

隨著近年來計算和實驗研究中高通量工作流程的發展,物理、化學和材料科學領域產生了大量的數據。為了更好地利用這些數據進行分析、驗證和進一步發展,材料科學領域的開放數據庫已經啟動,如材料基因組計劃(Materials Genome Initiative)、材料云(Materials Cloud)和聚合物數據庫(PolyInfo),這些數據庫均存儲了來自實驗和計算的材料結構及其相應的屬性。將機器學習(ML)整合到分子模擬中,促使許多數據驅動的方法開發基于ML的分子模擬模型。這些模型通常是通過輸入大量的數據來訓練的,如系統能量和原子力,這些數據由昂貴的高保真模擬內部產生。一些開放的數據庫已經啟動,以加速模型的發展,促進透明度和可重復性。然而,與其他領域相比,由于其固有的復雜性,化學化工領域的高質量數據集仍然有限。因此,建立一個收集和重用超級計算機本地存儲的模擬數據的平臺,不僅可以加速例如聚合物材料分子模擬的發展,而且可以節省資源,實現可持續性。結合上文提及的數據驅動多尺度模擬與分析技術和材料設計算法,如何開發一個高質量的云平臺,以改善開發化學化學品的數據存儲和共享將會是下一步工作目標。為了促進數據驅動的化學化工材料設計,本文作者團隊計劃創建一套數據存儲與分發的算法,包括標準數據格式和開放代碼庫,以處理來自不同尺度的實驗和模擬方法的數據。一個統一的數據存儲和標準化流程可以促進模擬和實驗的融合,從而在基礎設施上加快數據驅動地化學化工材料的創新設計。

3.2 科學計算軟件

科學計算軟件在現代科學的不同領域,從化學和生物學到物理學和材料科學,一直是一個寶貴的工具。以分子模擬為例,在過去的30 年里,人們為開發高效的計算算法和高質量的分子模擬包(如LAMMPS 和HOOMD-BLUE)付出了巨大努力?;谙冗M高效語言進行的并行算法的分子模擬軟件的開發使得多達數十億的原子分布在數十萬個計算節點上的計算成為可能,拉近了與實際應用場景的時空尺度。在此方向上,本文作者團隊基于現代的、面向科學計算的高性能動態高級程序設計語言Julia開發了應用于軟物質的大規模并行混合粒子場分子模擬軟件RobertoMD.jl[9]。然而,這些經典模擬器通常有一個巨大的專業代碼庫,如物理方程的手工梯度和用于GPU加速的定制CUDA或OpenCL內核,用C++或Fortran編寫,使得它難以適應快速發展的算法和硬件的進步。機器學習正在成為科學計算的一個重要方向,可以使分子模擬更加準確和高效。其中大部分的成功都歸功于自動微分的應用,它通過按照鏈式法則使其可以準確計算任意計算機程序的梯度?;跈C器學習框架的端到端(end-to-end)可微分(differentiable)分子模擬器,如TorchMD和JaxMD,最近已經被引入化學、物理、生物等的科學界。雖然目前更多的是作為一個原型設計平臺,但這些可微分的科學計算程序已經在各個領域展示了它們的優勢,如分子模擬其中的機器學習勢能函數的開發和部署。與LAMMPS 這樣的傳統分子模擬軟件相比,可微分的分子模擬程序可以很好適應機器學習勢能函數,而不需要費時且易出錯地手工推導,如神經網絡的梯度,或者與外部具有自動微分功能的代碼庫通信。開發一個完全端到端可微分的分子模擬器,并支持高度可并行處理的多個計算單元,將對無縫整合機器學習技術到大規模分子模擬中起到關鍵作用,縮小生產級分子模擬和機器學習技術之間的差距。

4 結語與展望

AI 與各個學科的融合發展已經成為一個熱門話題。從學術研究角度來看,幾乎所有的自然學科都有科研人員嘗試將AI 這個工具引入到其研究領域,以試圖探索新的研究方向[10]。但是,這一過程當前也存在著較多問題。目前很多研究者并不關心AI 算法在其自身領域的適用性和完善性,而是簡單地將AI 套用進原有科學問題中,利用AI進行簡單的數據處理,例如將原來用線性回歸解決的問題改成多層神經網絡預測,對進一步理解科學問題背后的微觀原理作用有限。在這些AI 應用場景之外,本文作者團隊認為,在化學品的創新設計中,AI的優勢體現在“生成”:即通過結合多尺度模擬,實現在已有研究結果中“生成”新特性和新產品,本文所討論的多尺度模型構建、高效設計方法和軟件開發將加速這一過程的實現。另外,將前人研究已經確定下來的物理作用和規則加入到AI 算法設計過程中,增加AI 模型的可解釋性與轉移性,也是在未來深入融合AI 與特定的科研領域的關鍵。綜上,本文主要介紹AI 方法在化學品設計與開發中的應用實踐,認為AI 驅動的科學研究應該是將AI 和科學研究進行高度關聯和耦合,旨在拋磚引玉,共同推進高性能化學品的創新設計發展。

猜你喜歡
模型設計
一半模型
重要模型『一線三等角』
何為設計的守護之道?
現代裝飾(2020年7期)2020-07-27 01:27:42
重尾非線性自回歸模型自加權M-估計的漸近分布
《豐收的喜悅展示設計》
流行色(2020年1期)2020-04-28 11:16:38
瞞天過?!律O計萌到家
藝術啟蒙(2018年7期)2018-08-23 09:14:18
設計秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
有種設計叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 人妻一本久道久久综合久久鬼色| 欧美精品v欧洲精品| 在线观看无码av五月花| 国产区免费| 久久久久国产精品熟女影院| 亚洲成人播放| 亚洲区视频在线观看| 人妻精品久久无码区| 福利在线免费视频| 国产情侣一区二区三区| 亚洲91精品视频| 9啪在线视频| 人妻免费无码不卡视频| AV天堂资源福利在线观看| 亚洲大学生视频在线播放| 国产手机在线ΑⅤ片无码观看| 国产男女XX00免费观看| 无码福利视频| 国产亚洲精品精品精品| 亚洲中文制服丝袜欧美精品| 国产欧美日韩va另类在线播放| 三级国产在线观看| 久久五月天国产自| 一区二区午夜| 午夜精品一区二区蜜桃| 国产日韩AV高潮在线| 欧美高清视频一区二区三区| 中文字幕在线观| 日韩国产另类| 狠狠操夜夜爽| 亚洲婷婷在线视频| 综合社区亚洲熟妇p| 久久综合九九亚洲一区 | 永久免费精品视频| 亚洲综合久久成人AV| av午夜福利一片免费看| 高清无码不卡视频| 大香伊人久久| 在线色国产| 国产精品极品美女自在线看免费一区二区| 真实国产精品vr专区| 国产又色又刺激高潮免费看| 色视频国产| 国产尹人香蕉综合在线电影 | 国产成人综合亚洲欧洲色就色| 日韩精品无码免费一区二区三区 | 亚洲人成人伊人成综合网无码| 东京热高清无码精品| 熟女日韩精品2区| 日韩欧美国产区| 日韩123欧美字幕| 激情无码视频在线看| 色婷婷亚洲综合五月| 亚洲日韩图片专区第1页| 色噜噜综合网| 国产成人综合亚洲欧美在| 欧洲一区二区三区无码| 综合亚洲网| 欧美午夜视频在线| 欧美午夜一区| 精品丝袜美腿国产一区| 欧美日本激情| 欧美a在线| 国产精品久久久久久影院| 久久中文字幕2021精品| 久久人人97超碰人人澡爱香蕉| 国产欧美在线观看一区| 激情五月婷婷综合网| 国产午夜一级毛片| 91精品专区国产盗摄| 99热这里只有精品免费国产| 色婷婷在线影院| 亚洲视频一区在线| 国产在线啪| h网站在线播放| 伊人久综合| 国产97公开成人免费视频| 国产精品尹人在线观看| 97se亚洲综合在线天天| 日本草草视频在线观看| 亚洲91在线精品| 福利视频久久|