楊英豪,王會良,蘇建新
(河南科技大學機電工程學院,河南 洛陽 471003)
數控機床作為現代制造業的關鍵基礎性裝備,已經在汽車制造、軌道交通、航空航天以及高鐵船舶等領域中得到了廣泛應用。機床可靠性水平作為整體性能的一項關鍵指標,體現了一個國家工業基礎裝備的發展水平。在“中國制造2025”整體規劃中,我國將高檔數控機床與基礎制造裝備列為重點發展技術領域,并提出到2025年,將關鍵機床裝備的MTBF提高到2000h的發展目標[1-2]。
在開展可靠性評估工作中,可靠性數據的采集與分析是后續研究工作的基礎,數據本身的質量與分析方法都會對結果產生較大影響。目前對可靠性數據的分析一般是以概率統計為基礎,對數據進行分布函數參數估計和假設檢驗[3-4]。但對于機床產品而言,其故障數據很難有效采集,數據容量往往也難以達到較滿意的要求,這就會存在參數估計值偏差較大和可能同時接受多種假設等問題。
人工神經網絡是AI中的一種信息處理系統,它可以通過對經驗信息的重復學習,達到預測、聚類、識別、函數擬合等功能,目前已經在圖像處理、專家系統、模式識別、數據預測等領域得到了廣泛的應用。文獻[5]采用ANN和HPSO算法建立了準確的失效分布模型,解決了在小樣本情況下參數估計的精確度問題;文獻[6]在乏數據情況下,建立了反向傳播神經網絡算法模型,解決了可靠性預計精度的問題;文獻[7]通過神經網絡的函數逼近能力對原始數據進行了擴充,并驗證了模擬數據所建立分布模型的準確性,結果表明人工神經網絡在可靠性分析中有進一步的研究價值。
作為神經網絡在可靠性評估中的應用,研究建立了基于自組織聚類學習的RBF神經網絡故障數據擴充算法模型,并對數控機床的故障數據進行了準確的可靠性評價工作,解決了在小樣本情況下存在模型求解有較大偏差的問題;同時為后續工作開展可靠性增長技術提供了相關依據。
考慮到數控機床產品的可靠性數據采集工作較為困難,研究對象選取國內某齒輪企業YK系列磨齒機,并根據產品在使用現場的運行記錄,采用定時截尾法對其進行故障數據的采集,并對樣本值進行排序:t1≤t2≤…≤tn,則故障數據的經驗分布函數Fn(ti)可由中位秩公式[8]近似計算:

式中:i—序號;n—故障總數。
經整理后的數據,如表1所示。

表1 故障數據統計表Tab.1 Failure Data Statistics
在得到故障數據的經驗分布函數后,需要假設其可能服從的失效概率分布,并對其進行參數估計和假設檢驗,從而完成故障類型的初步建立??煽啃岳碚撝谐2捎玫姆植碱愋陀校褐笖捣植迹龖B分布,對數正態分布和威布爾分布。為提高參數估計的精確度,對以上常見的分布函數采用參數的極大似然估計法,并利用MATLAB迭代求解,最后得到各分布類型的擬合累積分布函數。

累積分布函數與經驗分布函數擬合曲線,如圖1所示。

圖1 原始數據擬合曲線圖Fig.1 The Original Data Fitting Curve
分別對擬合累積分布函數進行假設檢驗,K-S檢驗效果好且適用于小樣本數據,故采用K-S檢驗法。作原假設H0:經驗分布函數服從某種分布,則檢驗統計量為:

取顯著水平α=0.1,當n=20時,D20,0.1=0.174,檢驗結果,如表2所示。

表2 原始數據K-S檢驗Tab.2 K-S Test of Original Data
由表2可知,在小樣本情況下,無法通過一般方法檢驗出準確的分布類型,這時需要擴大樣本容量。RBF神經網絡具有局部逼近功能且能逼近任意連續函數,因此可以利用RBF神經網絡算法實現對原始數據擴充,從而提高可靠性數據分析的精確度。
RBF神經網絡是一種前向神經網絡類型,它的網絡結構包括輸入層、隱含層和輸出層[9]。其基本思想是:用徑向基函數構成隱含層空間,隱含層對輸入量進行變換并轉換到高維空間,使其在高維空間內線性可分。在可靠性數據分析中,主要利用RBF網絡的函數逼近功能產生與原始數據具有一致分布類型的仿真數據,從而達到大樣本數據分析的目的。
RBF神經網絡根據徑向基函數中心的選取方法不同有多種學習策略[10-11],本模型以自組織聚類學習算法作為RBF神經網絡的學習方法。該方法主要包括以下兩個部分:(1)通過學習算法的輸出量確定神經網絡的基函數中心和擴展常數SPREAD;(2)通過有監督學習訓練確定隱含層到輸出層的權值。具體算法步驟如下:
假設有k為中心數目,n為樣本總數,第m次迭代的中心域為c1(m),c2(m),…,ck(m),則ω1(m),ω2(m),…,ωk(m)為相應的分析域。
(1)初始化。將表1中的經驗分布函數Fn(ti)與故障數據ti作為樣本輸入,并隨機選取k個原始數據作為初始中心域。
(2)聚類。計算所有輸入到指定中心的幾何距離,并對數據按間距最小原則進行聚類。

式中:xj—第j個樣本。
(3)更新中心域。

式中:ni—第i個分析域所含樣本數。
(4)判斷。若ci(m+1)≠ci(m),則轉到第二步繼續迭代;若中心域已經唯一確定,則確定基函數中心,迭代終止。
(5)訓練神經網絡。設計RBF神經網絡結構,并以上述步驟的輸出結果對其進行訓練,其中網絡的SPREAD值由中心域間的最小間距確定:

式中:p—重疊系數,一般取p=1.0。
(6)數據擴充。將隨機生成的累計分布函數值F(t)作為輸入值,則網絡的輸出即為擴充后的故障數據。
(7)參數估計與檢驗。將擴充的數據進行極大似然參數估計,并使用K-S檢驗確定符合的分布類型。
在MATLAB環境下,由以上流程編寫算法程序。
依據上述建模步驟進行仿真和驗證。為消除隨機參數介入帶來的計算偏差,設定迭代次數為500次,隨機選取14個樣本數據作為初始中心域,并將所有的樣本數據導入算法程序運行得到基函數中心和SPREAD值;然后建立神經網絡結構并以聚類分析結果對其進行訓練,訓練完成后再利用原始數據測試網絡的整體性能并計算數據擬合誤差。RBF神經網絡擬合曲線,如圖2所示。擬合誤差,如圖3所示。由圖2圖3可看出訓練的RBF神經網絡模型較好擬合了原始數據,訓練平均絕對誤差達到了11.02,因此該算法產生的模擬數據可以反映原始數據之間的函數分布規律。隨后將隨機生成的100個累計失效分布函數值導入RBF神經網絡模型,得到擴充后的故障數據。對擴充后數據進行參數極大似然估計,得到各分布類型的累積分布函數,其擬合函數,如圖4所示。

圖2 RBF神經網絡與原始數據擬合曲線圖Fig.2 RBF Neural Network Fitting Curve to the Original Data

圖3 擬合誤差圖Fig.3 Fitting Error Diagram

圖4 擴充數據擬合分布曲線圖Fig.4 The Expansion of Data Fitting Curve

同樣在顯著水平α=0.1下,對分布函數進行K-S檢驗,當n=100時,D100,0.1=0.0805,檢驗結果,如表3所示。

表3 擴充數據K-S檢驗Tab.3 K-S Test of Extended Data
由表3可知,在擴充數據后的假設檢驗中,只有威布爾分布是可以接受,由于擴充數據是通過RBF神經網絡仿真得到的,而RBF神經網絡的內插值數據統計規律與原數據保持一致,因此可以由擴充數據推斷出該型磨齒機故障分布類型服從威布爾分布。
通過上述研究,已經確定機床的故障分布類型服從威布爾分布。為了進一步定量描述機床的整體可靠性水平,通常需要計算一些評價指標,下面給出常用的可靠性評價特征量及估計值。機床的故障概率密度函數f(t)和故障率函數λ(t)分別為:

其特征函數擬合曲線,如圖5所示。

圖5 可靠性特征函數曲線Fig.5 Reliability Characteristic Function Curve
觀察失效率曲線呈上升趨勢,再結合浴盆曲線理論[12]可知,該型機床已經進入產品耗損失效期。在這個時期,機床失效率迅速上升,主要原因可能是由于機床子系統元器件的疲勞、磨損、老化等造成的。這時應該考慮對機床子系統做進一步可靠性分析工作,找出導致故障發生的直接原因,并采取相應的預防性維修措施來延緩機床的耗損失效。根據擴充后的分布模型對該型機床的各項可靠性指標進行評估,其中可靠度R的點估計值由下式計算:

MTBF觀測值與點估計值可由下式計算:

利用點估計公式計算MTBF的估計區間,即在90%的置信水平下,機床MTBF的雙側置信區間為:[876.16,1061.58]。
MTBF觀測值與點估計值在統計意義上是一致的,在實際應用中,由于擬合誤差及樣本容量的影響,兩者會存在一定差異。從計算結果可以看出兩者之間相差不大,這進一步證明了經神經網絡擴充后所建立故障分布模型的準確性。
(1)針對乏數據情況下數控機床故障分布模型不確定問題,建立了RBF神經網絡故障數據擴充算法模型,通過該算法擴充的數據不會改變原始數據統計分布規律,因而也為乏數據可靠性建模提供了一種有效的解決方法。(2)通過對算法擴充的故障數據進行參數估計與假設檢驗,可以唯一確定該型數控機床故障分布類型符合威布爾分布,同時在較大樣本下的模型參量估計結果也更為精確。(3)最后在此研究工作基礎上,給出了機床的可靠性評價特征量及關鍵指標估計值,完成了整機系統的可靠性評估工作,這為后續實施可靠性增長技術及制定維護措施提供了相應的指導借鑒。