張磊,賀丁,劉琳琳,都健
(1 大連理工大學化工學院,遼寧大連116024;2 中國寰球工程有限公司北京分公司,北京100012)
現代社會對化工產品從研發到推向市場的時間要求日益提高,化學工業關注的重點已從B2B產品轉向B2C產品[1]。因此,化工產品的設計得到廣泛關注。化工產品設計是指通過已知的產品性質或要求,尋找到符合性質要求的最優分子、混合物等化工產品。化工產品設計已成為化學工程學科新的研究熱點之一[2],近三十年來,化工產品設計相關的數據庫、模型與相關軟件均得到了快速的發展。然而,由于該問題的多尺度、跨學科特性,相關模型與軟件的開發通常需要涉及多學科的深入研究,例如計算化學、熱力學、材料科學、化學工程、工業工程、電子工程、數據科學以及人工智能等。傳統的化工產品設計開發主要依靠經驗與規則進行試錯式實驗方法。雖然此類方法可以設計得到可行的產品方案,然而其搜索范圍有限,無法得到全局最優的設計結果[3]。近年來,基于模型的化工產品設計方法得到了廣泛關注。使用基于模型的方法可以利用計算機算法對可行的產品設計方案進行快速遍歷,從而進行快速、低成本的產品開發。若必需的物性模型及數據可以準確獲取,則可使用基于模型的化工產品設計方法利用計算機技術進行產品設計。
圖1為化工產品設計方法的框架示意。對于一個給定的產品設計問題,首先,需要將產品需求轉化為對應的目標物理化學性質,并設定這些物性的可行范圍。其次,對于計算這些物性需要采用的模型、數據等進行調研與分析,并基于這些分析,建立產品設計數學模型。模型中包括目標函數(通常為產品開發成本、產品性能指標等)以及由物性模型、過程模型方程與產品結構、組成可行性方程、經濟模型、環境評估模型、可持續性評價模型等構成的一系列約束方程。對該優化模型利用特定的數學算法進行求解,即可得到使規定的目標函數達到最優的產品設計方案。而后,對得到的產品設計方案進行后續的經濟評估、原型測試并最終推向市場。因此,對化工產品進行設計的關鍵在于建立產品的結構、組成與產品性質之間的關系,即定量構效關系(quantitative structureproperty relationship,QSPR)模型。通過該模型,一方面,若已知產品結構組成,可對產品性質進行預測;另一方面,若已知產品性質要求,可反向應用,得到可行的產品結構組成。產品QSPR模型的建立需根據不同的產品類型以及物性采用不同方法,一般可分為機理模型、半機理模型及基于數據的模型。模型開發采用的技術包括量子力學(quantum mechanics,QM)、分子動力學(molecular dynamics,MD)、基團貢獻法(group contribution,GC)、有限元法(finite element,FE)、計算流體力學(computational fluid dynamics,CFD)、流程模擬方法以及機器學習等數據回歸方法。

圖1 化工產品設計方法框架[4]
近年來,針對化工產品設計已有大量綜述文章發表,以下列舉部分2000年之后發表的綜述文章。2004 年,Grossmann[1]以及Hill[2]指出化工產品設計將是化學工程未來的研究挑戰之一,產品設計的研究進入了快速發展階段。在單分子產品設計方面,Gani[3]綜述了計算機輔助分子設計(computer-aided molecular design,CAMD)技術在產品與過程設計中的應用;此后,Gani[4]對基于基團貢獻法的物性預測方法進行了綜述;Ng等[5]綜述了使用CAMD方法進行產品設計方法的挑戰與展望;Austin 等[6]綜述了使用CAMD方法進行產品設計的工具、應用案例及求解策略。對于更為復雜的產品類型,Gani與Ng[7]對分子、設備、功能及配方產品的概念設計進行了綜述;Butler 等[8]對使用機器學習方法進行分子與材料設計的研究進展進行了綜述;Uhlemann 等[9]對產品工程與產品設計方法的歷史、當前及未來的研究方向進行了綜述;Zhang 等[10-12]對產品與過程同步設計方法進行了綜述。雖然產品設計方法近年來得到快速發展,但這一領域的研究尚未得到完善,因此Ng 與Gani[13]指出了化工產品設計在研究與教學方面的問題與解決策略。
本文對基于模型的化工產品設計方法進行了綜述與展望。首先,對化工產品進行了分類,并針對不同類型的產品討論了適用的設計方法;其次,對化工產品設計使用的方法、模型、軟件等工具進行了綜述與討論;最后,對化工產品設計面臨的挑戰進行了討論與展望。
Zhang 等[3]將化工產品分為單分子產品、多組分產品以及設備3種類型。單分子產品又可分為小分子及大分子產品,多組分產品可分為配方產品以及功能性產品。如表1所示,本文根據使用范圍對化工產品進行分類,并對每種產品類型討論了其適用的產品設計方法以及設計中面臨的挑戰[4]。需要指出的是,化工產品種類十分豐富,因此表1僅就常見的產品進行了分類。
以下對表1中列舉的產品設計中面臨的部分挑戰進行詳細闡述。
許多有機化工產品可以根據QSPR進行設計得到,因此,其對于產品設計至關重要。在構建過程中,如何利用已有的數據與理論關系構建QSPR,是模型構建過程中的挑戰之一。例如,在乳化劑產品設計中,對于一些重要的性質,如Krafft 點、親水親油平衡值、表面張力等,由于QSPR 的缺失,使得設計過程難以進行。針對此類問題,對于產品性質相關的關鍵機制的深入理解有助于機理模型的構建,從而建立產品設計模型。根據產品的分子結構特征,利用QM、MD 或CFD 方法能夠揭示產品分子內與分子間的作用機制,有助于QSPR模型的建立。然而,對于一些產品需考慮的特殊性質,或復雜的產品組成成分,其作用機理尚未完全揭示,因此難以構建基于機理模型的QSPR,只能通過收集到的數據構建數據驅動模型來進行構建。

表1 常見化工產品類型、設計方法與挑戰
對產品與過程設計問題,建立多尺度模型可對涉及的各尺度詳細參數進行探究,并通過各尺度模型的結合,建立更為精確的預測模型。例如,在結晶過程中,通過CFD對結晶器操作過程的研究與物性預測模型的結合,有助于結晶溶劑(或反溶劑)的設計;在功能材料(例如催化劑或高分子膜)的設計中,利用QM 方法對微觀反應、粒子(電子)傳遞機理進行研究,并結合宏觀的流程模擬方法,可以得到更優的產品設計方案。為建立多尺度模型,需要從原子、分子尺度到設備單元與流程,以至企業級尺度的建模方法與軟件的結合,并研究各尺度之間信息的有效交互[27]。為解決多尺度建模帶來的模型復雜度的問題,模型降維、復雜模型求解算法以及代理模型開發方法等值得深入研究。
有毒物質的錯誤使用是造成工業生產事故的主要因素之一[28]。對于化工產品,在其設計的早期階段考慮安全、環境與可持續性因素可從根本上解決這些問題。因此,對于化工產品的安全、環境與可持續性因素的定量評估與預測模型是非常必要的。例如,安全與環境指標,包括LC50、全球變暖指數(GWP,global warming potential)、VOC (volatile organic chemicals) 等。對于此類問題,對EHS(environment, hazards and safety)指標的合理選擇以及如何定義其約束范圍仍有待解決[29]。
對于化工產品的大規模生產,在產品設計過程中需要考慮以下兩方面因素:①合成對應產品的有機合成反應路徑。對于化工產品,尤其是有機大分子,如何在考慮可持續性與經濟性的前提下,研究從特定原料合成該產品的有機反應路徑是目前面臨的挑戰之一。近年來,結合機器學習方法的有機反應路徑綜合方法開始得到關注[30]。②特定化工產品的生產過程設計。對于大宗化學品,其生產過程已十分成熟。然而,對于精細化學品,其生產過程通常根據經驗試錯方法進行設計。然而,此類產品通常在市場迭代十分迅速,因此,傳統的過程設計方法無法滿足要求。同時,精細化學品的生產通常涉及特殊的生產過程,例如物理/化學氣相沉積(PVD/CVD)、刻蝕、3D 打印等,這些生產過程一般缺乏機理模型描述。因此,如何設計得到創新的可持續的生產過程,利用多尺度建模進行過程強化[31]是亟需解決的挑戰問題之一。
由于化工產品設計問題的跨學科、多尺度特性,對于不同的產品類型,需要考慮不同尺度的需求,使用不同的方法與軟件進行建模求解。以下對常用的化工產品設計方法及相關軟件進行綜述。
化工產品最早使用基于實驗的試錯方法由專家進行篩選。對于具有復雜分子結構或特殊組分的產品,由于物性數據與模型的缺失,無法使用模型方法進行設計篩選,因此通過實驗,可以直接獲得所需的物性數據,從而篩選得到可行的產品設計方案。然而,通過實驗方法進行篩選僅能夠在有限的范圍內進行,同時需消耗大量時間與資金成本,因此難以得到最優的產品設計方案。雖然存在上述缺陷,實驗方法仍然是非常重要的產品設計方法。Tam等[32]通過實驗方法對導電油墨進行了設計,通過表面能量模型對聚對苯二甲酸乙二醇酯(polyethylene terephthalate,PET)連續相進行了設計,并使用實驗法對分散相進行篩選(例如正十四烷、乙醚、甲苯、環己烷等)。
將大量的實驗數據進行收集,可以整理得到包含不同物性的產品數據庫。對于特定的產品設計問題(例如小分子或配方產品的組分設計問題),可以基于此類數據庫進行數據庫搜索,從而得到可行的產品方案。通過數據庫搜索,可以快速高效進行產品設計,然而該方法一般僅用于產品方案的初步篩選。由于不同的產品類型需要不同的數據結構,因此,對于大量不同的化學物質與材料,如何有效地對復雜的數據結構進行管理是需要解決的挑戰之一。例如,對于溶劑、香精、原料藥、高分子膜等不同類型產品,需要使用具有不同數據結構的數據庫進行篩選。
經驗規則有助于進行產品設計決策,得到合適的產品方案,從而避免求解復雜的數學問題。這些規則通常從大量的專家知識、經驗等總結而得。基于經驗規則的設計方法的主要問題是規則之間常互相矛盾,導致規則的理解與應用的困難。另外,經驗規則通常僅對特定的產品類型在特定的范圍內有效。然而,由于基于經驗規則的設計方法通常可在極短的時間內得到相對較好的產品設計方案,因此,此類方法廣泛應用于化工產品設計中。例如,Wibowo 與Ng[33]利用基于經驗規則的設計方法對乳液類產品進行了設計。
在基于模型的方法中,產品設計問題可轉化為一組數學模型。針對涉及的模型及變量,該數學模型可分為線性規劃問題(linear programming,LP)、非線性規劃問題(non-linear programming,NLP)以及混合整數線性/非線性規劃問題(mixed-integer linear/non-linear programming,MILP/MINLP)。典型的產品設計數學規劃問題[3]見表2 所示。對于過程模型(方程3)及物性模型(方程4),若其均為線性方程,且固定產品設計相關決策變量(Y),則該數學模型退化為LP問題,例如使用GC方法預測Hansen 溶解度系數[34];若方程3 或4 包含非線性方程,則該數學模型退化為NLP 問題,例如使用GC 方法預測給定分子的熔點[34];對于僅由線性方程組成的分子設計問題(方程1、4、6),該數學模型退化為MILP 問題,例如使用CAMD 進行表面活性劑的設計[35];若該模型中包含非線性方程,則該問題為MINLP 問題,例如液液萃取溶劑設計[36]。化工產品設計常用軟件工具列于表3。
下面對化工產品設計常用的建模方法及工具進行討論。
2.4.1 量子力學(QM)
對于缺失的定量構效關系模型,可以采用從頭計算方法使用QM 進行計算,建立QSPR 模型。具體來說,對于表2 所示的產品設計數學規劃問題,當方程4 的相關模型缺失時,可以采用QM 計算獲得產品的物性值。例如,采用密度泛函理論(density functional theory,DFT)進行計算機輔助催化劑設計[37];利用QM 建立反應速率預測模型的反應溶劑設計[38]。Carter[39]對使用包括量子力學的模型方法進行材料設計的研究進行了綜述。目前,QM方法多用于物性預測。然而,受限于QM方法的計算精度與速度,其在CAMD中的應用仍然有限。結合QM 方法與機器學習建立半機理QM 模型來加速大分子的預測速度已成為近年來的研究前沿。然而,選擇合適的描述符對不同的產品設計模型建立特定的機器學習模型仍需進行深入研究。
2.4.2 分子動力學(MD)
與QM 方法類似,MD 可以通過分子尺度的模擬來獲取物性的預測結果,從而應用于分子設計或物性預測。在QM 與MD 方法中,通過分子的結構參數作為輸入,可以通過模擬獲得分子物性的輸出,從而識別分子結構細微的差別。MD方法目前已應用于藥物傳輸、氣體吸附、聚合物設計等方面。Al-Qattan 等[40]利用MD方法對基于碳納米管的藥物傳輸系統進行了設計。Kupgan等[23]使用MD方法對CO2捕集與分離聚合物介質進行了設計。Sledz等[41]對基于MD方法的藥物設計進行了綜述。然而,與QM 方法類似,雖然已有一些工作將MD 與CAMD 進行集成[42],然而受限于計算速度與精度,MD 方法仍難以應用于CAMD。利用MD 模擬結果建立代理模型,并將代理模型與產品設計模型進行集成,雖然會降低預測精度,但仍是該問題的解決方法之一。
2.4.3 基團貢獻法(GC)

表2 典型的產品設計數學規劃問題
在CAMD中,基團貢獻法是常用的物性預測方法之一,多應用于小分子及混合物中。然而,近年來的一些研究工作將其拓展至氨基酸[29]、酸解離[43]以及離子液體活度系數[44]等方面。雖然GC 方法對于某些體系在計算速度與精度上具有很大的優勢,然而由于對特定分子缺乏基團參數、對大分子計算精度無法保證、無法區分同分異構體等缺陷,限制了GC 方法的廣泛應用。針對這些問題,對GC 方法可以進行拓展,例如使用其他物性預測方法預測并回歸缺失的基團參數、拓展基團描述符使其能夠描述復雜的分子結構等,使GC 方法得到更為廣泛的應用。

表3 化工產品設計常用軟件
2.4.4 熱力學模型
熱力學模型通常用來預測相平衡、活度系數以及逸度系數等。這些參數可用于分離過程設計、產品穩定性分析以及預測某些與溫度、壓力及組成有關的物性,例如密度、溶解度等。Chao等[45]開發了UNIFAC-IL 模型,并將其應用于液液萃取過程的溶劑設計問題。同樣對于液液萃取過程溶劑設計,Scheffczyk等[46]開發了COSMO-CAMD模型框架。然而,這些熱力學模型通常包含大量非線性方程,若將這些方程集成于產品設計模型,其求解將是一個難以解決的問題。
2.4.5 粒數衡算模型(PBM)與計算流體動力學(CFD)PBM 通過偏微分方程組對粒子系統的動態行為進行建模,例如結晶、沉積、造粒、干燥、聚合、發酵等過程。因此,PBM 模型對此類產品及過程的設計是一個有力的工具。例如,對結晶產品形貌的控制[47]、聚合過程建模與優化[48]等。CFD 可用于分析與求解涉及流體流動的產品與過程。流體涉及產品生產過程中的大部分單元操作,因此,若對這些過程進行深入研究,則需使用CFD 建立模型并分析以及進行求解。例如,結晶器設計問題[49]、聚合流化床反應器設計[50]等。然而,PBM與CFD模型的規模及求解速度與難度限制了其應用于產品設計問題。另外,對于一些特殊的生產過程(例如凝聚、顆粒破碎等),其內在機理以及過程參數通常難以獲取,這一問題也限制了其廣泛應用。因此,對機理深入研究以及采用合適的數學模型進行建模并求解,以在計算速度與精度上進行平衡是非常必要的。
2.4.6 流程模擬
流程模擬工具在產品設計問題中可用于設計與篩選合適的生產過程并對過程參數進行優化,以獲得最佳的產品性能。例如,為確定設計得到的溶劑具有最佳的分離效果,對該溶劑涉及的分離過程進行精確的流程模擬非常必要[46]。然而,對于一些產品,其生產過程常采用某些特殊的生產過程,而這些非常規的單元操作模型并不包含在這些商業流程模擬軟件中,因此對于這些單元模型的開發是一項亟需解決的問題。
2.4.7 數據庫與數據驅動模型
對于不同類型的化工產品,通常已有大量的數據積累。這些數據按照一定的數據結構以數據庫的形式進行存儲。對于很多產品所需的物性,若其預測模型缺失,且機理尚未明確,則難以用前述方法建立模型進行物性預測。然而,利用機器學習方法對已有的大數據進行深入挖掘,建立基于數據的回歸模型,可以在機理不明確的情況下建立預測模型,從而輔助進行產品設計。例如,Gu 等[51]收集了197201 種天然產品的分子結構及其生物活性,并基于此建立機器學習模型進行了藥物設計。Dionisio等[52]建立了包括75000種日用化學品的數據庫,并基于此開發了日用化學品的設計與分析模型。
在現代社會中,化工產品具有舉足輕重的作用。雖然數十年來化工產品的設計方法一直在進行研究,該領域仍然是目前的研究熱點之一。基于模型與數據的系統性的產品設計方法與工具的應用可以顯著縮短產品的研發周期并降低研發成本。對于化工產品設計方向的一些展望總結如下。
面對眾多產品類型,目前已有的物性模型與數據庫亟需進行拓展。這些模型可以從以下3個角度進行開發:基于理論模型、基于數據模型以及二者的混合模型。對于一些特定的產品類型與物性,理論模型可能過于復雜且難以與產品設計模型進行集成,因此可以結合基于數據的回歸模型作為代理模型以進行模型的集成。
對于某些產品設計問題,需要使用多尺度模型與工具進行建模,以獲得更為精確的模型結果。例如,對于結晶器或結晶溶劑的設計,使用多尺度模型可以建立更為精細的模型:使用量子力學模型進行分子的結構優化并獲得力場參數,并將這些參數傳遞給分子動力學模型;使用分子動力學模型可以對結晶速率進行預測;在此基礎上,使用熱力學模型對固液相平衡進行預測;基于MD得到的結晶速率對晶體形貌進行預測,并使用CFD 模擬得到流動相關性質以及晶體粒度分布;最終,使用流程模擬工具對結晶器建立單元操作模型,得到結晶過程產率、純度等結果。然而,這樣的多尺度模型通常難以直接求解,同時計算速度也難以滿足設計要求。因此,開發大規模非線性優化問題的求解算法是解決這一問題的有效途徑之一。同時,對模型降維算法的研究也可有效降低模型規模與求解難度。例如,使用機器學習方法代替復雜的QM 計算[53],可同時滿足速度與精度要求;使用基團貢獻法快速生成σ-profiles[54]以代替耗時的DFT計算。
產品及其生產過程的協同設計有助于得到更優的設計結果。然而,目前由于模型復雜度的限制,以及缺乏相應的模型及參數,對于產品及其生產過程的同步設計仍是研究難點之一。對于一些特定的系統,例如制冷劑與制冷循環[16]、萃取過程與萃取劑[46]等,已有學者進行了深入研究。然而,對于大多數產品與過程的協同設計仍然非常困難。對于相關產品與過程模型的進一步開發以及大規模模型求解算法的研究,可有助于這一問題的解決。
雖然基于模型的產品設計方法及其工具在學術界已進行深入研究,然而,利用這些方法與工具實際解決的工業問題仍然非常有限。因此,工業界與學術界的深入交流與合作非常必要。另外,類似于通用流程模擬軟件,對于產品設計通用軟件工具的開發,對產品設計方法在教學、學術及工業的進一步理解與應用至關重要。
本文對基于模型的化工產品設計問題,從多尺度、跨學科的角度進行了討論,并對產品設計問題的挑戰與機遇進行了闡述。目前產品設計方法的研究僅對有限的幾種產品類型的設計(例如小分子及液體產品)進行了深入研究。對更多的產品類型(例如大分子、聚合物、高分子膜、藥物、催化劑等),開發更為普適的產品設計模型與工具,將不同的方法、模型、數據庫、求解算法等進行集成,可以對產品的構效關系進行更為深入的理解,并建立更為精確的模型。例如,對不同的產品類型,如何有效識別產品需求,如何將需求轉化為目標物性,如何有效管理問題的復雜度,并對多尺度問題建立兼顧精度與速度的模型等。為解決這些挑戰,對于產品構效關系的深入理解,集成機理與數據的建模方法、多尺度模型的深度應用、多模型與工具的深度集成以及工業界與學術界的深度合作都十分必要。相信在未來的產品設計中,基于模型的方法定會得到更為廣泛的應用,從而有助于快速、安全、有效地得到兼顧性能、可持續性以及環境友好的產品。