陳祝丹,李大字*,劉 軍,高 科
(1.北京化工大學 信息科學與技術學院,北京 100029;2.北京化工大學 材料科學與工程學院,北京 100029)
玻璃化溫度(Tg)作為聚合物的重要工藝指標,指聚合物高彈態與玻璃態之間的轉換溫度。溶聚丁苯橡膠(SSBR)[1]在Tg以上表現為具有高彈性的高彈態,在Tg以下表現為具有脆性的玻璃態。由于橡膠的Tg會影響其物理性能、阻尼性能、耐熱性能等,其一直是橡膠性質的重要指標。
影響合成橡膠Tg的因素包括聚合物中各組分含量和微觀結構等[2-3]。合成橡膠的Tg通常采用差示掃描量熱儀、動態熱機械分析儀等測試[4-6],Tg測試值會隨測試方法和條件的變化而改變,且無法預測Tg,即測試缺乏擴展性和靈活性;測試過程需進行重復試驗,消耗大量的人力和物力,測試結果還會受到設備的影響。不同苯乙烯和丁二烯含量的SSBR的Tg不同,要實現其良好表征,目前測試方法的預測分析能力受到極大地限制。
隨著機器學習在材料學科的應用越來越廣泛[7-9],研究學者開始開發新的方法研究高聚物的Tg測試。通過神經網絡來建立高聚物的Tg預測模型是一種普遍且備受關注的方法[10],但神經網絡也有很多不足。神經網絡需要依賴訓練數據,數據的多樣性和數量對網絡性能具有重大影響。橡膠每次合成和表征都需要研究人員進行設計和反復試驗,這限制了訓練數據的多樣性。
高斯過程回歸[11]是基于統計學理論,可以在模型搭建的過程中自適應地得到超參數,并給予預測輸出明確的概率解釋。因此,與反向傳播(BP)神經網絡相比,高斯過程回歸具有更少的參數和更快的收斂速度,以及對小樣本、非線性問題具有難以取代的優勢[12]。
本工作以實例數據為樣本,利用高斯過程回歸模型分析苯乙烯和丁二烯含量對SSBR的Tg的影響,從而預測Tg,以期為實際生產過程中預測和控制橡膠的Tg提供參考。
高斯過程回歸是一種貝葉斯學習框架下的無參數核方法[13-14]。通過直接對函數建模,產生非參數模型。對訓練輸入數據X=x1,x2,x3,…,xn,x*及其對應輸出數據Y=y1,y2,y3,…,yn,y*建立的回歸方程為

式中:回歸函數f(X)不需要指定具體形式,可以認為是在高斯回歸過程中采樣得到的一個無窮維的點;N(0,n2σ)表示均值為0、方差為n2σ的噪聲;G(0,K)是均值為0、協方差為K的高斯回歸過程;對于新輸入x*和對應輸出y*仍有相同的映射關系。
利用協方差函數,即核函數反映高斯回歸過程中數據點之間的相互關系,本課題選取徑向基(RBF)核函數作為協方差函數:

式中,K(x,x′)是x與x′之間的協方差,σf和l為可調節的參數。
要求取一個新輸入x*及其對應輸出y*依然滿足上述高斯分布,利用上述協方差矩陣可以得出式(3)和(4):

根據貝葉斯回歸方法,預測數據y*的條件分布P(y*|y)服從如下高斯分布:

分布的均值可以作為y*的估計值:

分布的協方差表示預測值的不確定性:

因此,高斯過程回歸模型不僅可以模擬任何黑盒模型,還可以計算置信區間,即計算模擬的不確定性。
本課題采用數據從文獻[15]中獲取,在橡膠合成過程中,采用復合結構調節劑調節苯乙烯和丁二烯含量,合成了多種結構的SSBR,研究苯乙烯含量對SSBR的Tg的影響。試樣包含12種苯乙烯含量的SSBR,其苯乙烯含量為5%~45%,丁二烯含量為24%~78%。不同苯乙烯和丁二烯含量SSBR的Tg如表1所示。其中,1#—8#試樣數據構建高斯過程回歸模型,9#—12#試樣數據驗證模型的有效性。

表1 不同苯乙烯和丁二烯含量的SSBR的TgTab.1 Tg of SSBR with different styrene and butadiene contents
利用表1中1#—8#試樣數據作為訓練數據,參數設置為σf和l,建立高斯過程回歸模型。同時,利用相同的訓練數據和測試數據,本課題構建BP神經網絡模型作為對比試驗。為了提高BP神經網絡模型的預測能力,對訓練數據和測試數據進行了歸一化處理。通過多次試驗,優化選取了2-8-1網絡結構,即網絡有3層,輸入層包含2個節點、隱含層包括8個節點、輸出層包含1個節點,學習率設為0.2。
SSBR的Tg測試數據和訓練數據輸出結果如表2所示。測試誤差采用絕對誤差和相對誤差來表示,前者反映誤差的大小,后者是絕對誤差占真值的百分比,可以反映誤差的偏離程度。
從表2可以看出,BP神經網絡模型Tg預測值的最大絕對誤差和最大相對誤差分別高達26.47 ℃和44.9%,高斯過程回歸模型預測的最大絕對誤差和最大相對誤差分別為2.37 ℃和5.5%,后者結果更理想。高斯過程回歸模型的偏差遠小于BP神經網絡模型,表明高斯過程回歸模型的可靠性和有效性。

表2 SSBR的Tg測試數據和訓練數據輸出結果Tab.2 Testing data and train data output results of SSBR
為了了解2種模型的有效性和泛化性,對苯乙烯含量為5%~45%和丁二烯含量為24%~78%的SSBR的Tg進行預測,在設定范圍內均勻采取40 000組含量值作為輸入,求高斯過程回歸模型和BP神經網絡模型對應預測的Tg,并將預測結果繪制成3D圖像,如圖1和2所示。

圖1 高斯過程回歸模型預測SSBR的Tg的3D圖像Fig.1 3D image of Tg of SSBR by Gaussian process regression model
從圖1可以看出,SSBR的Tg與苯乙烯和丁二烯含量的有關。在苯乙烯含量不變時,Tg隨丁二烯含量增大而升高;在丁二烯含量不變時,Tg隨苯乙烯含量增大而升高。高斯過程回歸模型的輸出結果與試驗數據分析結果[15]一致,這也證明了該模型的可靠性和有效性。
從圖2可以看出,BP神經網絡模型預測的三維曲面不符合已知的映射關系。根據BP神經網絡的特性推想模型效果不佳的原因是訓練數據過少,從而BP神經網絡中的參數訓練不完全。

圖2 BP神經網絡模型預測SSBR的Tg的3D圖像Fig.2 3D image of Tg of SSBR by BP neural network model
(1)通過實例數據分析表明,高斯過程回歸建立的SSBR的Tg預測模型切實可行,還可對一定范圍內苯乙烯和丁二烯含量對SSBR的Tg的影響進行定性和定量分析。
(2)與BP神經網絡模型相比,高斯過程回歸模型解決小樣本問題具有優越性,可為更多復雜耗時的試驗數據預測提供有效解決方案。
(3)高斯過程回歸模型可通過添加更多Tg數據,即通過增加學習數據,進一步提高模型的預測精度和可靠性。