盧旭,賴修文
(西南交通大學機械工程學院,成都 610000)
鎢合金是一種典型的兩相復合材料,它通常是由體心立方的球狀鎢顆粒和低熔點元素基體組成,常用的基體元素有Ni、Fe、Cu、Cr、Mo和Co等[1]。傳統的鎢合金制備方法為液相燒結法。在制備過程中,將鎢粉與低熔點元素粉混合,經水壓機壓實并在有穩定氫氣流的爐中燒結。在燒結過程中,低熔點的元素熔化并形成基體,基體將未熔化的鎢顆粒結合在一起。一部分鎢溶解在基體中,并沉淀在剛生成的鎢顆粒上,從而增大鎢顆粒的尺寸。因此燒結鎢合金的微觀結構在本質上是低熔點的基體膠結鎢顆粒[2]。鎢合金結合了鎢和基體材料的優點,包括高密度、高強度、低熱膨脹系數、良好的耐腐蝕性和延展性等[3-4]。因此其被廣泛應用于化工、電子、醫療等民用領域及火箭噴嘴和動能穿甲彈等軍用領域[5-6]。鎢合金的高密度特性使其制造的動能穿甲彈以較小的體積擁有較大的動能,而其高強度和良好的延展性能確保穿甲彈滿足發射和擊中目標的各種要求。因此鎢合金在高應變率下的力學響應成為了眾多學者關注的焦點[7-8]。
Lee等[9-10]使用霍普金森壓桿沖擊由92.5W-5.25Ni-2.25Fe合金制成的φ10 mm×5 mm的圓柱形試件,獲得了鎢合金在初始溫度25~1100 ℃及應變率為800~4000 s-1時的力學響應。由實驗數據分析可知,鎢合金的流動應力隨著溫度的升高而降低、流動應力隨著應變率的升高而增大。
Yu等[11-12]在對90W-7Ni-3Fe合金的動態沖擊實驗中發現鎢合金的流動應力受到應變硬化和熱軟化耦合作用的影響。Fan等[13]研究發現細晶鎢合金的流動應力幾乎不受應變硬化和應變率硬化的影響。Hu等[14]測試了具有不同微觀結構的鎢合金的動態力學響應,結果表明,鎢顆粒尺寸、鎢-鎢鄰接度、基體相體積分數都會對鎢合金的流動應力造成影響。因此,應變、應變率、初始溫度是影響鎢合金流動應力的3個主要因素。
在過去的幾十年里,學者們常用本構模型建立流動應力和影響因素之間的關系,比如考慮了塑性應變、塑性應變率及溫度的Johnson-Cook[15]本構模型,即JC本構模型。此模型公式結構簡單,基于簡單的實驗便可擬合參數,因此該模型被廣泛應用于材料的流動應力預測。Sharma等[16]基于6種溫度和3種應變率下的實驗數據擬合了92.5W-5.25Ni-2.25Fe合金的JC本構參數并為模擬提供了基礎。然而此類經驗數學模型有一定的缺點,首先該類模型缺乏實際的物理基礎,其次模型中參數的確定通常是基于對實驗數據的回歸分析,而影響材料流動應力的因素是高度非線性的,因此該類本構模型的適用范圍有限[17]。
神經網絡是一種受人類神經系統啟發的非線性映射系統,具有結構簡單、自學習能力強的優點[18]。考慮到本構模型中存在的問題,近年來許多學者嘗試將神經網絡應用于材料流動應力的預測。Haghdadi等[19]用神經網絡預測了A356鋁合金在400~540 ℃及0.001~0.1 s-1下的流動應力并取得了較好的效果。YAN等[20]對Al-6.2Zn-0.70Mg-0.30Mn-0.17Zr合金在準靜態下流動應力的預測也獲得了較高精度。由此可見神經網絡是預測材料流動應力的強有力工具。
在本文中,將選擇合適的神經網絡結構對鎢合金在動態沖擊載荷下的流動應力進行預測,其中以應變、應變率和初始溫度作為輸入量,以流動應力作為輸出量,并將實驗數據、神經網絡預測結果與JC本構模型的預測結果進行對比,以此來評價訓練得到的網絡的合理性。
本文中使用的原材料是一根φ44 mm×84 mm的粗晶95W-3.5Ni-1.5Fe合金棒料,該鎢合金由燒結制得。該材料的初始微觀結構如圖1(a)所示,球狀鎢顆粒均勻地分布在黏結相中。在實驗中,試樣采用由線切割加工成的φ4 mm×3 mm的圓柱形試樣,如圖1(b)所示。

圖1 鎢合金初始微觀結構及試樣圖
為了獲取該鎢合金在不同初始溫度、應變率下的流動應力,使用帶有加熱爐的霍普金森壓桿設備對鎢合金圓柱形試樣進行動態沖擊實驗。
實驗裝置如圖2所示,霍普金森壓桿設備主要由發射裝置、入射桿、透射桿、吸收桿等部分組成。入射桿、透射桿均由55CrSi制成。在實驗中,圓柱形試樣被安裝在入射桿和透射桿之間,試樣與桿的接觸面會涂抹高溫油以保證其充分接觸。發射裝置與氮氣瓶相連,調節氣壓值來發射不同速度的撞擊桿。當撞擊桿接觸到入射桿時,入射波在入射桿中產生并沿著撞擊桿的沖擊方向傳遞,當入射波傳到試件時,部分入射波反彈回入射桿成為反射波,部分入射波通過試件傳到透射桿成為透射波。入射波、反射波、透射波可被貼在入射桿和透射桿中間位置的應變片檢測。

圖2 霍普金森壓桿設備

調節發射裝置的發射壓力以及加熱爐溫度,一共測得了應變率為2200、3100、4000、4500、5300 s-1及 初 始 溫 度 為25、300、500 ℃等共15種工況下該鎢合金的應力應變曲線,如圖3所示。為了確保數據的有效性,每種工況下進行3次重復性實驗。當測試初始溫度不是25 ℃時,加熱爐升溫到測試溫度后,恒溫維持15 min以確保試樣受熱均勻。

圖3 不同初始溫度、應變率下的應力應變曲線
考慮了應變硬化、應變速率硬化和熱軟化的JC熱黏塑性本構模型計算公式為

式中:σy為流動應力;A為該鎢合金在參考應變率和參考溫度下的屈服強度;B為應變硬化系數;C為應變率硬化系數;n為硬化指數;m為熱軟化指數;εp為等效塑性應變;ε˙p為等效塑性應變率;ε˙0為參考應變率,本文中參考應變率取0.001 s-1。準靜態下的壓縮實驗通過萬能試驗機實現,T*為無量綱溫度,其計算公式為:

式中:T為材料溫度;T0為參考溫度;Tm為鎢合金的熔點。
基于實驗中獲得的應力-應變曲線,擬合得到該鎢合金的JC本構參數,如表1所示。

表1 95W-3.5Ni-1.5Fe合金JC本構參數
1943年,McCulloch和Pitts[21]提出第一個神經元模型(即MP模型)。在此基礎上,Rosenblatt[22]對MP模型賦予了學習功能并提出了單層感知器模型,然而該模型不能很好地處理線性不可分問題。直到1986年,Rumelhart等[23]提出了反向傳播神經網絡,其能處理部分單層感知器模型無法處理的問題。
反向傳播神經網絡是一種受人類神經系統啟發而產生的非線性映射系統,其具有結構簡單、自學習能力強等優點。如圖4所示,反向傳播神經網絡由3部分組成,即輸入層、隱含層、輸出層。網絡的學習過程分為兩個步驟:輸入前向傳播計算輸出和誤差反向傳播。網絡的訓練過程本質上就是一個不斷試錯的過程,訓練過程中以減小預測值與目標值之間誤差為目標。

圖4 反向傳播神經網絡結構
在輸入前向傳播計算輸出過程中,輸入層的節點根據公式(4)將數據傳輸到隱含層:


利用MATLAB 2016中nntool工具箱進行反向傳播神經網絡設計。網絡的預測能力和泛化能力是評價其好壞的標準。而網絡的表現受到諸多因素影響,如訓練函數、激活函數、隱含層的數量及隱含層中的節點個數。為了確定最優的網絡結構,下面設計并測試具有不同激活函數、隱含層數量、節點數量的網絡結構。首先該網絡在輸入層有3個節點,分別對應于影響流動應力的3個參數,即應變ε、應變率ε˙、溫度Tinitial。在輸出層有一個節點,即流動應力σy。在網絡測試中使用了應變率為2200、3100、4000、5300 s-1及初始溫度為25、300、500 ℃等共12種工況下的數據。每種工況下分別取35個應變下的流動應力,應變以0.03為起點,0.005為增量,0.2為終點,共取35個數據點。在12種工況下共獲取420個數據點。在網絡訓練過程中,70%的輸入數據作為訓練樣本,另外30%作為測試樣本,并且數據隨機選取。4500 s-1下的3組實驗數據用于驗證網絡的泛化能力。
對于訓練函數的選擇,常用的有量化共軛梯度法(SCG算法),Levenberg-Marquardt算法(LM算法),貝葉斯正則化算法(BR算法)。每一種算法都有其各自的優缺點。SCG算法的權值沿著梯度的負方向下降,其優點在于損失函數下降很快,缺點是未必能實現最快收斂[24]。LM算法在訓練中等規模的前反饋神經網絡方面表現良好,特別是在函數擬合方面[25]。然而該算法有時會將局部最小值當作全局最小值,從而導致網絡的預測能力較差。BR算法是基于LM算法的一種改進算法,其以均方誤差最小為目標對權值和偏置進行更新。該算法最大的優勢在于使用其建立的網絡具有較好的泛化能力。此外BR算法克服了噪聲數據和過擬合的問題。該算法的缺點在于它的收斂速度比LM算法慢。考慮到用于網絡訓練的數據量不大,所以訓練的時間成本可以忽略,其次要求網絡有較強的泛化能力,所以選擇BR算法作為訓練函數。
在nntool工具箱中有3種激活函數,即Logsig函數、Tansig函數和Purelin函數。它們的表達式如式(9)~式(11)。Logsig函數和Tansig函數都能將輸入值歸一化到(0,1),Tansig函數還具有對稱性[26]。Purelin函數的特點是輸入等于輸出。

隱含層選擇1或2層,由于輸入層節點數為3,因此隱含層節點數選擇2、3、6進行網絡設計。當隱含層數為2時,第2隱含層的激活函數和節點數與第1隱含層設置相同。不同結構網絡的訓練結果如表2所示。其中MSE和相關系數R2作為評判網絡好壞的標準。R2的計算公式為

表2 不同結構網絡的均方誤差和相關系數

R2越趨近于+1,正相關性越強[27]。
由表2可知,3種激活函數中,Purelin函數的表現最差,Logsig函數和Tansig 函數表現相近。隱含層數和節點的增加均會使相關系數出現較為明顯的增大。當隱含層中節點數從2增大到6時,網絡性能出現顯著的提升。經對比,激活函數為Tansig的3-6-6-1結構為最佳網絡結構。如圖5所示,該結構在訓練樣本和測試樣本中的均方誤差分別為4.1 和64.1,相關系數R2分別為0.9978 和0.9964,因此該網絡結構預測流動應力具有較強的可靠性。

圖5 反向傳播神經網絡回歸分析
圖6 展示了反向傳播神經網絡 預 測 值、JC 本構方程預測值和實驗曲線的對比情況。神經網絡對鎢合金在沖擊載荷下流動應力的預測能力要優于JC本構方程。為了定量對比神經網絡與JC本構方程的預測能力,選用統計學參數平均絕對相對誤差AARE進行對比,其定義為

圖6 不同載荷下神經網絡預測值、JC本構方程預測值與實驗數據對比

式中:Tk為目標輸出值;Ok為預測輸出值。
平均絕對相對誤差AARE是驗證模型預測可靠性的無偏統計量,通過對比每一個預測值與實驗值間的相對誤差來判斷模型的預測能力[28],兩種模型的AARE如表3所示。數據表明,神經網絡模型對流動應力的預測精度要遠高于JC本構方程的預測精度。因此建立的神經網絡模型對鎢合金流動應力的預測具有可靠性與準確性。

表3 神經網絡和JC本構方程的R和AARE
為了證明該網絡的泛化能力,使用其預測應變率為4500 s-1,初 始 溫 度為25、300、500 ℃時的流動應力,如圖7所示。這3種工況下的實驗數據在訓練神經網絡時未使用。當Tinitial為25、500 ℃時,神經網絡對流動應力的預測值與實驗值極為接近,當Tinitial為300 ℃時,雖然預測值與實驗值間略有偏差,但流動應力的變化趨勢相近且誤差在可接受范圍內。因此該網絡結構也具有較好的泛化能力。

圖7 4500 s-1 時神經網絡預測值與實驗數據對比
利用神經網絡結構預測一些訓練模型時未出現的工況,如圖8所示。鎢合金的流動應力對溫度有一定敏感性,當Tinitial從100 ℃增大到200 ℃時,流動應力只有輕微減小,而當Tinitial增大到400 ℃時,流動應力出現明顯下降。應變的硬化作用會使流動應力增大,隨著應變的增大,其硬化作用逐漸減弱。應變率對應變的硬化作用影響不大,而Tinitial從200 ℃增大到400 ℃時,應變硬化作用發生顯著改變。應變率的增大會導致流動應力的增大,在Tinitial相同的情況下,應變率越高,應變率的硬化效果越弱。

圖8 神經網絡預測不同載荷下的應力應變曲線
基于霍普金森壓桿設備對鎢合金圓柱試件在不同載荷下的動態沖擊實驗數據建立反向傳播神經網絡,并將其與JC本構模型的預測能力進行對比,主要結論如下:1)Purelin函數不適用于流動應力的預測,網絡的預測能力隨著隱含層中節點數的增加而增強,隱含層層數對網絡預測能力的增強影響較小;2)使用Tansig函數作為激活函數的3-6-6-1網絡結構具有最好的預測能力,其在訓練樣本和測試樣本中的均方誤差分別為4.1和64.1,相關系數分別為0.9977和0.9964,且具有較好的泛化能力;3)對比JC本構方程和反向傳播神經網絡的預測值與實驗值間的平均絕對相對誤差AARE,可知反向傳播神經網絡對鎢合金流動應力的預測能力更強。