顧秀江,姚竹亭,王煜杰,秦新紅,劉永峰
(中北大學機械工程與自動化學院,山西太原030051)
傳動系統中齒輪箱是重要部件之一,齒輪箱的運行是否正常,直接影響到整個機械系統的工作,因此了解齒輪箱的故障模式,對整個機械裝置非常重要[1]。傳統的故障診斷方法僅是表達了診斷過程某個環節所用的科學理論與工具,并不能反映診斷過程的本質。人工神經網絡是一種大規模的分布式并行處理系統,具有自組織、自學習、自適應和非線性動態處理等特性。D-S證據理論可以很好地解決在故障診斷中的不穩定性因素以及單一傳感器所反映出信息的不精確問題。將神經網絡和D-S證據理論相結合,對于解決復雜機械的故障問題具有較好的應用前景。
BP神經網絡即誤差反向傳播神經網絡,是一種糾正學習的多層前饋神經網絡,它可以實現從輸入到輸出的任意非線性映射,權值的調整采用反向傳播學習算法。
典型的BP網絡結構如圖1所示,包括輸入層、隱含層和輸出層。在進行故障診斷時,BP網絡第一層作為各個測點信號的特征向量,即故障征兆層{x1,x2,…,xn},各元素xi對應網絡輸入的神經元,這些數據經過各隱層節點,經過變換函數,將隱層節點的輸出信號傳播到輸出節點,經過處理后得到輸出數據yi,即對應各種故障分類的輸出層{y1,y2,…,yn}。BP網絡具有一個或多個隱含層,其激活函數必須是處處可微的,經常使用S型對數、正切激活函數和線性函數[2]。

圖1 三層BP網絡結構
采用傳統的BP算法有時會出現收斂速度慢、陷入局部極值和難以確定隱含層節點的個數等問題,鑒于BP算法存在以上缺點,有必要對BP算法進行改進。
(1)附加動量法。標準BP算法只按照負梯度方式修正權值和閾值,并容易陷入局部極值和收斂速度慢等問題。加入動量項考慮了過去權值變化的影響,抑制網絡陷于局部極小。改進算法[3]如下
W(k+1)=W(k)+η[(1-α)D(k)+αD(k-1)]式中,W(k)表示單個神經元的權值向量;D(k)=-?E/?W(k)為k時刻的負梯度;α為動量因子,0≤α<1;η為學習率,η>0。
(2)自適應調整學習率。該方法有利于縮短學習時間,標準BP算法收斂速度慢的一個重要原因是學習率的選擇不當。學習率選得太小,收斂太慢;學習率選得太大,則有可能修正過量,導致振蕩甚至發散。因此可選用自適應調整學習率。

當連續兩次迭代其梯度方向相同時,表明下降太慢,這時可使步長加倍;當連續兩次迭代其梯度方向相反時,表明下降過量,這時可使步長減半。
D-S證據理論可以很好地解決在故障診斷中的不穩定性因素以及單一傳感器所反映出的信息不精確、不完整、模糊性等問題。
D-S證據理論的算法模型[4]如下:
(1)識別框架。設U表示X所有可能取值的一個論域集合,且所有在U內的元素間是互不相容,則稱U為X的識別框架。
(2)基本概率賦值。設U為一個識別框架,則函數m∶2U→[0,1]且滿足下列條件

則m(A)表示對命題A的基本可信度,稱為A的基本概率賦值;m(A)表示對命題A的精確信任程度,表示對A的直接支持,其中φ為空集。
(3)信任函數。設U為一個識別框架,m∶2U→[0,1]是U上的基本概率賦值,定義函數BEL:2U→稱該函數是U上的信任函數。
(4)焦元與核。若識別框架U的一個子集為A,具有m(φ)=0,則稱A為信任函數BEL的焦元,所有焦元的并稱為核。
D-S證據合成規則是一個反映證據聯合作用的規則。給定幾個同一識別框架上的基于不同證據的信度函數,如果這幾批證據不是完全沖突的,那么就可以利用該合成法則計算出一個信度函數,而這個信度函數就可以作為那幾批證據聯合作用下產生的信度函數。
設BEL1和BEL2是同一識別框架U上基于不同證據的兩個信度函數,m1和m2分別是其對應的基本可信度分配,焦元分別為A1,A2,…,AK和B1,B2,…,BK,若A?U且m(A)>0,設

則合成后的基本可信度分配函數m∶2U→[0,1],表示為

K的大小反映了證據沖突程度,稱為沖突系數。系數1/(1-K)稱為歸一化因子,它的作用是為了避免在合成時將非零的概率賦給空集[5]。
齒輪箱中主要可能產生故障的結構是軸、齒輪和軸承。而齒輪、軸承的故障數量占大多數,所以齒輪、軸承的故障也就成為傳動系統上的主要故障[6]。對這些部件進行故障診斷的依據就是軸、齒輪和軸承的缺陷會通過振動信號反映到箱體表面上,這種振動信號是箱體壁產生振動并激發空氣而產生的。在齒輪箱診斷中,當零部件在運轉過程中發生故障時,機體受到的動態激勵和動態響應都發生變化,并且當故障的位置和形式不同時,機體動態響應的變化方式也有所不同。分析響應激勵信號和系統的特征參數,通過模式識別方法判斷齒輪箱的工作狀態。
在診斷中,特征值是比較可靠的診斷指標,常用一些動態特征值來判斷系統的狀態,但是各種時頻域特征值有各自的應用缺陷,對齒輪箱故障診斷能力也各有不同,只有把它們綜合起來才能得到比較完整的信息。文中選取6個時頻域特征參數:偏度、最大值、峰態、裕度指標、峭度指標和相關因子,輸入層神經元的個數等于特征向量的個數。實驗中,設正常狀態F1、軸承內圈剝落F2、齒輪崩齒F3這3種狀態下,分別測取的振動信號進行齒輪箱故障診斷研究,輸出層神經元的個數等于齒輪箱的故障狀態個數,輸出向量為F1~F3的齒輪箱的3種狀態。T=[1 0 0]表示正常狀態F1,T=[0 1 0]表示軸承內圈剝落F2,T=[0 0 1]表示齒輪崩齒F3。
隱含層神經元個數的選取會影響神經網絡訓練的性能,三層BP網絡隱含層節點數h參考經驗公式[7]為和h=2m+1,其中,m,n分別是輸入層和輸出層的神經元的個數;a是[1,10]間的常數,得到隱含層節點數近似為13。

表1 訓練樣本數據
隱含層神經元上的傳遞函數采用S型正切函數Tansig,輸出層神經元傳遞函數采用S型對數函數Logsig。初始的動量因子和學習速率分別設為0.95和0.1,訓練精度0.000 1,訓練次數10 000次,分別采用一般梯度下降法和自適應學習速率動量法進行訓練。訓練結果如圖2所示。

以上論述表明,采用自適應學習率動量法訓練BP網絡,訓練速度較快并且能夠準確識別齒輪箱的故障狀態。
為避免單一傳感器存在的固有缺陷,有必要融入更多傳感器信息以識別齒輪箱的狀態,增加診斷的準確性。故可將神經網絡和D-S證據理論結合起來,針對不同的測點設計不同的子神經網絡進行局部診斷,然后將各個測點的局部診斷結果采用D-S證據理論進行決策層融合診斷,提高診斷的準確性。

圖3 基于改進BP網絡和D-S證據理論的融合診斷模型
采用融合模型如圖3所示,將3個測點測取的振動信號進行預處理,并提取需要的特征參數。每個測點首先進行神經網絡局部診斷,將神經網絡的單通道輸出經過歸一化處理[8],直接作為各故障狀態焦點元素的基本概率分配,從而避免了D-S證據理論構造基本概率分配函數的困難性;將神經網絡的訓練誤差作為不確定因素,然后采用D-S證據理論組合規則逐次合并各通道的診斷信息,得到該征兆域獨立的局部診斷結果。最后的融合結果如表2所示。

表2 最終融合結果
由表2可知,融合診斷提高了診斷系統對故障分類識別的精度和可靠性。
通過實驗可知,將改進BP網絡與D-S證據理論相結合進行診斷時,避免了構造D-S證據理論的基本概率賦值函數的困難性,同時利用神經網絡大規模并行工作方式增強了信息處理的快速性,且可以盡量減少不確定性因素的影響。綜上所述,采用神經網絡與D-S證據理論相融合技術進行齒輪箱故障診斷是有效可行的。
[1] 高永生,唐力偉,王建華,等.基于系統傳遞特性的齒輪箱齒根裂紋故障診斷[J].診斷與檢測,2006(2):117-118.
[2] 梁斌梅.改進梯度下降BP算法在地下水位預測中的應用[J].煤炭技術,2009,28(11):144-145.
[3] 王光研,許寶杰.RBF神經網絡在旋轉機械故障診斷中的應用[J].機械設計與制造,2008(9):57-58.
[4] 曾元簽.D-S證據理論及其改進算法研究[J].艦船電子工程,2010,30(10):48-49.
[5] 何冰,胡紅麗.一種修正的D-S證據融合策略[J].航空學報,2003,24(6):559-561.
[6] 孫紅輝,張振仁,姚良.基于神經網絡信息融合的柴油機故障診斷[J].機電工程技術,2005,34(12):74-76.
[7] 張德峰.Matlab神經網絡應用設計[M].北京:機械工業出版社,2009.
[8] LIANG H.Small target detection in multisensor system based on Dempster-Shafter evidence theory[J].The International Society for Optical Engineering,2001(9):272-279.