劉芳寧,王 越,孫瑞俠
(中國航發北京航空材料研究院,北京 100095)
鎳基高溫合金K4169在-253~700 ℃溫度范圍內有良好的綜合性能,被廣泛應用于航空航天領域,用于工作溫度一般不高于650 ℃的壓氣機盤、渦輪盤和葉片等高溫合金鑄件[1]。K4169合金的強度、疲勞應力等性能由微觀組織直接決定[2],其組成相包括基體相γ相、球狀的γ′相、薄片狀的γ″相、圓形島狀的Laves相和針或盤狀的δ相[3],其中體心正方結構的γ″相是主要強化相,但其穩定性差,在高溫下分解為δ相和γ′相;γ′相是面心立方結構,是合金的輔助強化相;δ相出現在γ基體中時顯著降低合金的強度;Laves相是合金的有害相,在晶界及枝晶間處大量析出,呈白色塊狀。Laves相作為K4169中的一種脆性相,在應力作用下成為裂紋源和擴散通道,顯著降低合金的高溫性能。碳化物則作為夾雜物常存在于合金中[4]。如果能夠掌握合金微觀組織與性能間的關系規律,就能夠通過控制合金相析出和溶解,來提高組織均勻性,從而進一步提升合金的力學性能和穩定性,獲得滿足不同強度級別和使用要求的各種零件。對K4169合金微觀組織與性能之間關系的研究,常規的方法有實驗測量和模擬仿真[5]。但由于K4169合金的微觀組織與性能之間沒有明確的線性邏輯關系,因此無法通過模擬仿真建立;而實驗測量成本高,耗時長,且實驗結果難以控制,同樣不適用于研究合金微觀組織與性能之間的定量關系。
2011年美國提出“材料基因組計劃(materials genome initiative, MGI)”,強調通過高通量技術、計算模擬和機器學習等方法,加速新材料的制備,使得材料的開發速度比原先至少提高一倍[6]。機器學習能夠根據已有數據,在大量、高維度樣本中通過算法學習快速建立特征與相關因素之間的關系,并不斷更新和優化以提高模型準確性。機器學習的實用性在于,幾乎不需要有關研究對象的先驗知識,并且可以從經驗數據中準確學習控制性能變化的規則。機器學習的編程范式如圖1所示[7],利用機器學習,人們輸入的是數據和從這些數據中預期得到的答案,系統輸出的是規則。

圖1 機器學習的編程范式[7]Fig.1 Programming paradigm of Machine Learning[7]
將機器學習的方法運用到材料特性的預測中,能夠加速新材料的研發設計并降低成本,同時充分挖掘已有數據的價值,在此方面材料信息學已有大量研究并取得顯著成果[8-10]。這些研究成果涉及的主要材料類別有:金屬材料[11, 12]、非金屬材料[13, 14]、陶瓷材料[15]、熱電材料[16]等。針對不同的研究對象和具體問題,應選擇不同的機器學習方法,典型的機器學習方法有:線性和非線性分析、決策樹理論、遺傳算法、人工神經網絡等。另外,材料描述符的選擇和特征維度的控制也是機器學習對材料性能預測是否準確的關鍵因素。Liu等[17]提出了一種數據驅動的多層特征選擇方法,該方法結合了名為DML-FSdek的領域專家知識,無需手動調整超參數即可輸入訓練數據。他們對10個材料屬性數據集的測試研究表明,該方法可以自動搜索比初始特征集具有更低均方根誤差的特征集。
根據分析的規模,機器學習在材料特性預測中的應用可以分為宏觀性能預測和微觀特性預測兩大類。對材料的宏觀性能研究主要集中在宏觀性能與微結構之間的關系。多層感知器(multi-layer perceptron, MLP),又叫人工神經網絡,本質上是一種非線性的統計分析技術,具有很強的自學習、自適應能力,目前廣泛應用于材料性能預測、加速模擬計算和輔助材料表征中。例如,Fu等[18]采用MLP、隨機森林(random forest, RF)、支持向量機(support vector machine, SVM)和梯度增強算法(gradient boosting,GB)分別預測了蠕變條件(溫度、外加應力和時間)對DZ125合金γ′相體積分數、γ′相筏化程度、γ′相厚度等微觀組織退化的影響,結果表明,MLP預測結果誤差最小,預測準確性最好。Liu等[19]建立了基于分治法的用于預測單晶高溫合金蠕變性能的機器學習模型,該算法能夠有效區分不同類別的高溫合金,并選擇最優模型進行進一步預測。該方法比實驗更快,成本更低,能夠為蠕變斷裂壽命建立準確的結構-特性關系映射,并有望用于合金的逆向設計。機器學習對材料微觀特性的預測包括預測材料的晶格常數、能帶、電子親和力和分子霧化能等。Jiang等[20]基于SVM、序列最小優化、MLP等機器學習算法,建立化學成分、溫度等錯配度敏感特征與晶格錯配度的關系模型,并從實驗與機理兩方面對模型進行有效性檢驗,實現鎳基單晶高溫合金γ′相和γ相晶格錯配度的準確快速預測。結果表明,MLP模型相關系數高,誤差低,和傳統經驗公式相比,預測準確性和效率更有優勢。
本研究通過設計實驗,突破了K4169標準成分和熱處理工藝范圍,通過改變合金成分和熱處理制度,獲取了不同組合變化下對應的微觀組織和性能數據。分析了成分和熱處理制度變化對合金室溫、高溫力學性能的影響,并采用機器學習算法建立預測模型,預測了微觀組織變化對合金力學性能的影響,為合金微觀組織和性能之間的關系提供定量分析方法,加速新材料的研發過程,為合金優化提供指導。
本研究的整體框架如圖2所示,首先,設計不同的成分和熱處理制度并開展合金熔煉和微觀組織觀察,獲得對應的微觀組織金相照片和SEM照片,對照片中的析出相進行統計計算以獲得相含量,通過拉伸實驗獲得不同相含量對應的拉伸性能數據;其次,采用隨機化和歸一化方法對合金微觀組織特征數據和拉伸性能數據進行預處理,為模型的建立做準備;再次,通過支持向量回歸(support vector regression, SVR)、隨機森林回歸(random forest regression, RFR)、K-最近鄰回歸(K-nearest neighbor node regression, KNR)和MLP[21]這4種算法建立合金微觀組織和室溫、高溫拉伸性能的關系。采用K折交叉驗證對預測的準確性進行驗證,采用均方誤差(mean square error,MSE)、平均絕對誤差(mean absolute error,MAE)、相關系數(correlation coefficient,CC)、決定系數(R2)對結果進行評估。MSE和MAE值越小,預測的結果越準確;CC值和R2值越大,預測結果與實際結果越接近,模型的準確性越高。最后,根據誤差評估結果選取最優模型作為高溫合金微觀組織-拉伸性能之間關系的機器學習預測模型。

圖2 整體框架Fig.2 Overall framework of this study
為了提高鎳基高溫合金的高溫強度,通常會基于固溶強化、第二相強化、晶界強化等綜合效果對合金進行成分優化。其中,Al,Ti,Nb是沉淀強化元素,其含量對合金高溫時的組織穩定性有重要影響;而Mo能夠減慢Al,Ti,Cr元素的高溫擴散速率,減緩合金的軟化速率,有效提高合金的高溫強度。因此,本實驗設計了7組成分(表1)并據此熔煉鑄錠。其中,第一組取K4169合金標準范圍內成分,第二組和第三組是在標準成分基礎上改變了Al含量,第四組和第五組改變了Mo含量,第六組和第七組改變了Nb含量。

表1 7組合金名義成分
實驗以標準熱處理制度為基礎,分別設計了10種熱處理制度,考察合金微觀組織在不同熱處理階段的變化。高溫合金K4169常見的標準熱處理制度為:1095 ℃/1~2 h(空冷或更快冷)+955 ℃/h(空冷)+720 ℃/8 h(爐冷)至620 ℃,保溫8 h(空冷)[22]。設計的包括該熱處理制度在內的10組參數見表2。

表2 本實驗采用的熱處理制度
基于上述成分和熱處理制度進行正交實驗,綜合利用金相顯微鏡、掃描電鏡和透射電鏡觀察樣品,并采用X射線衍射(X-ray diffraction, XRD)對樣品不同階段的微觀組織進行表征,計算獲得不同相的體積分數,主要關注的微觀組織特征數據有γ相、γ′相、γ″相、δ相、Laves相、碳化物等,這些數據即為模型的輸入數據;同時通過拉伸實驗收集測量的試樣室溫和600,650 ℃高溫拉伸性能數據,本實驗采用室溫拉伸數據作為建立合金微觀組織與室溫力學性能關系模型的輸出數據,采用600 ℃的拉伸性能數據作為建立合金微觀組織與高溫力學性能關系模型的輸出數據。
機器學習研究的問題分為分類問題和回歸問題,分類問題輸出的是所屬的類別,回歸問題輸出的是具體值,回歸模型是在分類問題的基礎上演化而來的。本實驗通過建立K4169合金微觀組織與力學性能之間的定量關系,從而建立預測模型,因此研究的問題為回歸問題。
目前應用廣泛的機器學習回歸模型有SVR、RFR、KNR和MLP等,其中SVR的優化目標是結構化風險最小,不同于其他算法以經驗風險最小為判斷依據,因此具有更優秀的泛化能力,SVR的核函數提供了從輸入空間到高維空間的映射,降低了算法的復雜度,優化了回歸過程;RFR有較強的抗過擬合能力,且非常穩定,只有在半數以上的基分類器出現差錯時才會做出錯誤的預判;KNR算法訓練時間復雜度比SVR之類的算法低,與樸素貝葉斯算法相比,對數據沒有假設,且對異常點不敏感;MLP是一種對高度非線性數據關系進行建模的神經網絡,不需要事先對數據分布進行假設,并且應用到新數據時預測準確性良好。
2.3.1 數據預處理
在機器學習中,數據預處理在訓練模型之前是必要的過程。為了保證模型預測結果的準確性,在數據的預處理階段,首先,將數據進行隨機排序;其次,數據的離散化和規范化作為預處理過程中的常見和關鍵過程,可以減少極端值和異常值的影響,使模型更穩定。本數據集包含的數據本身為數值型,數據本身符合離散化標準,對數據的規范化方式為Z-score規范化,經過處理的數據的均值為0,標準差為1。轉化公式見式(1):
(1)

2.3.2 建立室溫拉伸力學性能模型
本實驗中SVR、RFR、KNR算法模型的構建基于Python語言中的Scikit-learn算法包[23]完成,MLP基于Python語言中的Keras人工神經網絡庫完成。
(1)SVR對室溫力學性能的預測
本實驗中,對合金室溫力學性能的預測分別采用了SVR算法的線性核函數(linear)、多項式核函數(polynomial)、徑向基核函數(radial basis function, RBF)建立模型,預測結果如圖3所示,圖中水平軸為實測值,垂直軸為預測值,截距為0、斜率為1的直線為理想直線,圖中散點離該線越近,則說明預測的室溫力學性能與測量值的一致性越高。從圖3中可以看出,線性核函數的預測模型準確性較好,徑向基核函數次之,多項式核函數的模型預測結果較差。

圖3 K4169合金室溫拉伸強度的支持向量回歸(SVR)算法預測結果和實驗數據對比:(a) 線性核函數,(b) 多項式核函數,(c) 徑向基核函數(RBF)Fig.3 Comparison between the predicted results by SVR algorithm and the experimental data of tensile strength of K4169 alloy at room temperature: (a) linear, (b) polynomial, (c) RBF
(2) RFR對室溫力學性能的預測
RFR算法中,并不是所有節點都參與當前節點屬性指標的計算,影響預測結果的主要參數是樹棵數k的選擇,本實驗中k值設為10,圖4為預測結果。從圖4中可以看出,該算法的預測結果基本沿對角線分布,說明預測值和實驗結果基本吻合。

圖4 K4169合金室溫拉伸強度的隨機森林回歸(RFR)算法預測結果和實驗數據對比Fig.4 Comparison between the predicted results by RFR algorithm and the experimental data of tensile strength of K4169 alloy at room temperature
(3) KNR對室溫力學性能的預測
影響KNR預測模型準確度的重要指標是近鄰個數k,本實驗將k的取值分別設置為1~6,計算其預測結果與實際實驗結果的MSE、MAE、CC及R2,結果如表3所示。結果表明,k=6時的誤差最小,相關系數最高,此時的預測結果見圖5,從圖中可以看出,該算法的預測結果基本沿對角線分布,說明預測值和實驗結果基本吻合。為保證觀測點的近鄰比遠處的鄰近點具有更大的影響力,每個鄰近點的權值設置為與觀測點距離的倒數,此處距離為歐拉距離。


圖5 K4169合金室溫拉伸強度的K-最近鄰回歸(KNR)算法預測結果和實驗數據對比Fig.5 Comparison between the predicted results by KNR algorithm and the experimental data of tensile strength of K4169 alloy at room temperature
(4) MLP對室溫力學性能的預測
通過調整層數和節點數,確定了MLP對KCH69室溫力學性能預測的模型的過擬合臨界點參數。實驗表明,MLP的室溫力學模型的最佳參數為:層數為3層,第一層和第二層節點數為64,第三層節點數為1,激活函數為Relu時,模型預測的準確性最好,此時模型的MSE值為0.17,MAE值為0.32,CC值為0.95,R2值為0.85。預測結果見圖6,從圖中可以看出,該算法的預測結果基本沿對角線分布,說明預測值和實驗結果基本吻合。

圖6 K4169合金室溫拉伸強度的多層感知器(MLP)算法預測結果和實驗數據對比Fig.6 Comparison between the predicted results by MLP algorithm and the experimental data of tensile strength of K4169 alloy at room temperature
為了減小模型預測中過擬合情況的出現,在模型訓練過程中,采用了k折交叉驗證來避免偶然性。交叉驗證作為一種模型驗證技術,可用于評估統計分析結果推廣到獨立的數據集時該算法的預測效果。將本實驗中的數據分為訓練集、驗證集和測試集3類。首先留出所有數據集的1/5為測試集,剩余數據為訓練集和驗證集,其劃分方法為:設D為訓練集,將D分為4個互斥的分區D1、D2、D3和D4,隨機有17或18個實例。回歸算法執行10次,每次使用3個分區進行訓練,留下1個分區進行驗證。通過10次重復的四折交叉驗證對模型進行分析和驗證。
2.3.3 建立高溫拉伸力學性能模型
對高溫拉伸性能的預測采用同樣的算法SVR、KNR、RFR和MLP,每種算法執行10次,評估結果取10次執行結果的平均值。4種算法預測結果與真實實驗數據的對比如圖7所示。從圖中可以看出,相比于其余3種模型,MLP算法的預測結果命中對角線的次數較高。

圖7 K4169合金高溫拉伸強度的不同算法預測結果和實驗數據對比:(a) 支持向量回歸(SVR),(b) 隨機森林回歸(RFR),(c) K-最近鄰回歸(KNR),(d) 多層感知器(MLP)Fig.7 Comparison between the predicted results by different algorithms and the experimental data of tensile strength of K4169 alloy at high temperature: (a) SVR,(b) RFR,(c) KNR,(d) MLP
圖8是不同成分合金在不同熱處理制度處理后的室溫和600,650 ℃拉伸強度。從圖8中可以看出,同一成分的合金在不同熱處理狀態下的室溫拉伸強度均高于其高溫拉伸強度,相同熱處理制度處理后的合金強度值在600與650 ℃下差異很小,表現出較好的高溫穩定性。

圖8 不同成分合金在不同熱處理制度處理后的拉伸強度:(a)室溫,(b)600 ℃,(c)650 ℃Fig.8 Tensile strength of alloys with different compositions after different heat treatment treatments: (a) room temperature, (b) 600 ℃, (c) 650 ℃
圖9顯示了4種算法建立的模型的室溫拉伸強度預測值和實測值的MSE、MAE、CC以及R2值對比,從圖9a和9b中可以看出,與其余3種模型相比,MLP模型的MSE和MAE均為最低;從圖9c和9d中可以看出,MLP模型的CC和R2最高,因此選取該算法為根據相含量預測室溫拉伸強度的最優算法,該算法的MSE為0.17,MAE為0.32,CC為0.95,R2為0.85。

圖9 不同算法對合金室溫拉伸強度預測的誤差評估結果:(a) 均方誤差,(b) 平均絕對誤差,(c) 相關系數,(d) 決定系數Fig.9 Comparison of error evaluation results of predicting tensile strength of alloy at room temperature by different algorithms: (a) MSE, (b) MAE, (b) CC, (d) R2
對4種模型的600 ℃高溫拉伸強度預測結果的定量化誤差分析結果見圖10。從圖10a和10b中可以看出,MLP模型的MSE和MAE均為最低;從圖10c和10d中可以看出,與其余4種算法相比,MLP算法的CC和R2最高,因此選取該算法為根據相含量預測600 ℃高溫拉伸強度的最優算法,該算法的MSE為0.14,MAE為0.29,CC為0.97,R2為0.91。

圖10 不同算法對合金高溫拉伸強度預測的誤差評估結果:(a) 均方誤差,(b) 平均絕對誤差,(c) 相關系數,(d) 決定系數Fig.10 Comparison of error evaluation results of predicting tensile strength of alloy at high temperature by different algorithms: (a) MSE, (b) MAE, (b) CC, (d) R2
本研究以高溫合金K4169為基礎,設計并制備了不同成分和熱處理制度處理后的高溫合金鑄件,觀測并計算微觀組織中的相含量,并對不同鑄件的室溫拉伸強度和600、650 ℃高溫拉伸強度進行測量,獲取了相含量和力學性能的數據。合金室溫和高溫拉伸性能實驗結果表明,成分一定時,合金的室溫拉伸強度整體高于高溫拉伸強度;600與650 ℃下拉伸強度差異很小,表現出較好的高溫穩定性。
采用支持向量回歸(support vector machine regression, SVR)、隨機森林回歸(random forest regression, RFR)、K-最近鄰回歸(K-nearest neighbor node regression, KNR)和多層感知器(multi-layer perceptron, MLP)這4種機器學習的回歸預測模型,確定最佳參數,建立相含量與室溫拉伸、高溫拉伸力學性能的關系。對4種模型的預測值誤差分析表明,MLP的預測準確性最高。本實驗證明,根據材料的成分、工藝、微觀組織、性能等信息, 采用機器學習的方法建立關系模型,可為合金微觀組織與性能之間的關系提供定量的分析方法,并實現對材料性能的預測。與普通機器學習算法相比,以MLP算法為代表的深度學習預測模型對材料性能的預測準確性更高,若將它應用到材料性能實驗中,可有效加速材料的試制過程, 為材料設計及新材料的研發提供輔助和指導。此外,機器學習中模型的準確性和訓練數據的數據量有較大關系,后續研究中將收集更多的數據,并補充到數據集中,以提高模型的準確性。