王體春,方磊磊,童昌圣
(南京航空航天大學 機電學院,南京 210016)
復雜機械產品運行過程中存在著大量的數據信息[1],有效利用這些數據信息可以判斷復雜機械產品的運行狀況[2],在運行情況異常時及時發現并示警[3-4],減少企業損失。國內外對于產品運行狀態預測分析的研究主要分為3類。第1類是基于模型驅動的方式對復雜機械產品運行狀態進行預測分析。張鵬等[5]綜合考慮變壓器的功能結構及性能,得到一種考慮部位和性能的電力變壓器差異化評價方法。該方法能夠準確識別變電力變壓器運行狀態,分析異常情況且準確率較高。李耀華[6]使用小波包墑ABC-BP神經網絡模型對直升機齒輪箱運行狀態進行分析,結果證明該模型具有良好的故障診斷作用。第2類是基于知識推理的方式對復雜機械產品運行狀態進行預測分析。張維等[7]提出了一種基于模糊推理和滑動平均相似度分析的輔助設備故障預警方法,結果證明該方法能夠有效預測運行狀態,對故障進行示警;劉華一等[8]提出一種基于語義網的機床故障診斷知識擴展方法和一種應用該方法的知識擴展平臺體系結構,并基于上述知識擴展方法和平臺體系結構進行機床故障診斷知識擴展平臺開發,驗證了知識擴展功能在知識模型構建和知識庫實例擴展方面的有效性。第3類是基于數據驅動的復雜機械產品運行狀態預測分析。褚菲等[9]提出一種全潛魯棒偏M估計的復雜工業過程最優狀態的魯棒評價方法,使用樣本數據加權方式對產品運行狀態進行評價,對于現代復雜工業產品運行狀態評價有參考意義。劉立生等[10]使用離散小波變換和神經網絡相結合的方法對直升機振動信號進行預測分析,結果證明了模型的有效性。燕凱等[11]運用大數據關聯規則技術,綜合電力的相關大數據,建立計量設備的運行模型及故障預警知識庫,從而實現電力計量設備裝置的運行狀態分析。
上述模型能夠對復雜機械產品運行狀態進行有效預測分析,但在預測分析過程中往往存在著準確率較低、預測時間較長等問題。因此,本文中將可拓理論與神經網絡相融合,結合可拓本體的概念模型分析,在前人研究的基礎上構建改進的可拓神經網絡結構[12-13],建立了基于改進可拓距的可拓神經元,進而形成了復雜機械產品運行狀態可拓神經網絡預測分析模型;通過具體的案例分析對算法和模型進行驗證,并使用BP神經網絡進行對比,結果表明了模型與算法的有效性和可行性。
可拓神經網絡是典型的有監督學習的雙權神經網絡,利用若干結果已知的樣本數據對可拓神經網絡進行訓練,學習參數,使輸出結果與目標結果相符。將復雜機械產品運行信息特征值劃分等級,得到運行狀態評估經典域。將運行狀態經典域以及運行數據作為改進可拓神經網絡的輸入量,經過訓練得出復雜機械產品運行等級權值和聚類中心。
可拓神經網絡由輸入層和輸出層組成,輸入層與輸出層之間通過雙權值連接,分別為對應特征經典域的上界和下界。例如,第i個輸入層神經元和第j個輸出層神經元之間的上界和下界用表示。可拓神經網絡結構如圖1所示。
復雜機械產品運行狀態預測分析的實質是區間分類問題??赏鼐嗍强赏厣窠浘W絡中的重要衡量工具,用來描述待測物體與目標區間中心的距離。對于某一個區間,點x到區間中心的可拓距可以表示為:
由式(1)可以看出:復雜機械產品運行狀態等級區間上下界確定時,若x<wL,則ED≥0;若wL<x<wU,則ED<0;若x>wU,則ED≥0。即當復雜機械產品運行特征值可拓距滿足該等級要求時ED≤0,反之ED>0。相較于以往的可拓距,該可拓距的表述更加清晰明了,且樣本空間較少,適合復雜機械產品運行狀態特征值的區間判定。改進的可拓距函數圖像如圖2所示。
可拓神經網絡結構中的神經元被稱為可拓神經元,是組成可拓神經網絡的基本結構??赏厣窠浽卸鄠€參數輸入和一個結果輸出。每個輸入參數都是一個物元變量,中間狀態用輸入信號的經典域的上界和下界表示,輸出結果y為:
在可拓距建立后,將復雜機械產品運行數據特征區間樣本作為輸入量進行訓練,進行運行狀態等級判定,實現預測分析。圖3為改進的可拓神經元結構。
在復雜機械產品運行狀態可拓神經網絡訓練之前,應先確定復雜機械產品運行數據樣本的對象名稱、特征以及對應的特征量值,建立其物元模型:
其中:R為復雜機械產品運行數據物元;O為復雜機械產品運行數據樣本的對象名稱;C1,C2,…,Cm為復雜機械產品運行數據樣本對象O的物元特征;v1,v2,…,vm分別為復雜機械產品運行數據樣本的對象O關于物元特征C1,C2,…,Cm的特征量值。
假設復雜機械產品運行數據樣本集合X={X1,X2,…,XNp},其中Np為復雜機械產品運行數據樣本數量,則第i條復雜機械產品運行狀態評估樣本數據表示為為復雜機械產品運行數據物元特征值數量。整個集合的學習誤差表示為Er=Nm/Np,Nm為總的訓練錯誤數。可拓神經網絡訓練學習實施的具體過程表述如下:
1)建立復雜機械產品運行狀態特征可拓經典域模型,表示可拓神經網絡輸入節點和輸出節點權值。
2)計算復雜機械產品運行狀態對應物元模型特征量值區間的初始中心。
其中:k表示復雜機械產品運行狀態預估等級;i表示物元模型中的復雜機械產品運行狀態特征類別。
3)讀入第i個訓練模式的第p個運行狀態評估特征的樣本數據利用可拓距函數計算訓練樣本和第k種復雜機械產品運行狀態聚類的關聯度。
4)確定k*,使得EDik*=min{EDik}。如果k*=p,則按照如上過程進行下一次訓練,直到完成所有模式的訓練,否則更新權值和聚類中心后重新訓練。權值和聚類中心的調整方法如下所示。
5)更新第p個復雜機械產品運行狀態樣本和k*的權值:
其中η為學習效率。
6)更新第p個復雜機械產品運行狀態樣本和k*的聚類中心,即:
7)如果聚類過程收斂并且總誤差符合要求,則訓練完成,否則重復訓練過程。
若復雜機械產品運行數據樣本的數據差距較大,則對其進行歸一化處理。
對數據集合X={x1,x2,…,xn}使用式(14)來進行歸一化處理:
當數據計算完畢時,采用反歸一化公式:
本文中所提出的基于改進可拓神經網絡的復雜機械產品運行狀態預測分析模型流程如圖4所示?;诟倪M的可拓神經網絡的復雜機械產品運行狀態評估模型實現的具體步驟表述如下:
步驟1確定復雜機械產品運行狀態評估目的,主要為運行狀態數據預測分析、運行狀態識別及提醒。
步驟2確定復雜機械產品運行狀態評估樣本的對象名稱、特征以及對應的特征量值。
步驟3基于式(3)建立復雜機械產品運行數據樣本的可拓物元,使得復雜機械產品運行數據特征能更好地進行表述及使用。
步驟4基于式(4)建立復雜機械產品運行數據特征經典域,確定運行狀態的等級上下權值。
步驟5構建改進的可拓距模型,得到改進的可拓神經元結構,將復雜機械產品運行特征經典域作為改進可拓神經網絡的輸入進行訓練。
步驟6建立復雜機械產品運行狀態評估可拓神經網絡訓練學習模型,即通過式(5)~(15)改進可拓神經網絡的模式訓練。
步驟7當準確率達到要求時結束訓練;若未能達到要求,則返回步驟6進行訓練,直至準確率達到要求。
步驟8建立復雜機械產品運行狀態分析BP神經網絡訓練學習模型,即對復雜機械產品運行數據進行BP神經網絡的訓練,通過收斂速度和收斂率對二者進行對比,得出結論。
直升機作為典型的復雜機械產品系統,在飛行過程中產生了數量龐大的數據,且成分復雜,影響因素眾多。對某型號直升機的飛行狀態樣本數據庫進行特征提取,將直升機旋翼轉速、主減速器滑油冷卻系統及滑油壓力作為主要影響特征進行評估。選取的研究對象相較于其余飛行特征參數較容易采集,通過對應的傳感器即可采集到相應數據,且選取的特征可以有效識別評估飛行狀態。將飛行狀態設置為空載、正常、過載和嚴重過載等4種情況,按照飛行狀態等級劃分,每個等級為100條,共計400條數據,使用Matlab和Java語言進行可拓神經網絡訓練。從每個等級中隨機抽取5條不同時間、不同飛行情況的共計20條測量數據進行展示。部分飛行狀態樣本數據如表1所示。

表1 某型號直升機飛行狀態樣本數據(部分)
某型號直升機飛行狀態樣本數據的物元模型為:
此時的旋翼轉速、主減速器滑油溫度和滑油壓力都為原始數據。某型號直升機旋翼轉速的范圍是0~250 r/min,主減速器滑油溫度的范圍是0~130℃,滑油壓力為0~9.14 kg/cm2。樣本的輸入波動較大,范圍廣,易導致可拓神經網絡的訓練時間過長,因此需要對直升機飛行狀態樣本數據進行歸一化處理,將各個特征值的范圍歸一化到[0,1]范圍內。
使用式(14)對表1樣本進行歸一化處理,歸一化后的樣本數據如表2所示。

表2 某型號直升機飛行狀態樣本歸一化數據
由式(4)可知,可拓經典域模型需要可拓物元模型的特征上下權值為:
其中:Oi(i=1,2,3,4)為對應的4種直升機飛行狀態;Cm(m=1,2,3)為直升機飛行狀態的判別因素,此處表示直升機旋翼轉速、主減速器滑油溫度和滑油壓力;〈aim,bim〉為各影響因素對應的取值區間,此處表示4種直升機的飛行狀態范圍。參考美國NASA制定的相關飛行標準以及參考文獻[14-15]的要求,得出某型號直升機飛行狀態評估經典域物元模型表達式,如表3所示。

表3 某型號直升機飛行狀態評估經典域物元模型表達式
通過圖5可知,直升機飛行狀態評估可拓神經網絡訓練過程中錯誤率逐漸下降,準確率逐漸上升,在第80次左右訓練時錯誤率趨于平穩,準確率達到99%,此時訓練過程結束。
在可拓神經網絡訓練完成后從直升機飛行樣本數據庫中再次抽取100條數據用于檢驗模型的準確性。這些數據是新的數據,不包含之前訓練數據。對測試數據實現歸一化操作,之后輸入訓練模型,其標定的飛行狀態和評估的飛行狀態樣本歸一化數據如表4所示。通過驗證發現,測試結果與標定結果相符合,準確率達到99%,證明了可拓神經網絡在直升機飛行狀態監測過程中的可行性及有效性。

表4 某型號直升機飛行狀態樣本歸一化數據
為更加有效地說明本文中模型以及算法的優越性,采用廣泛應用的BP神經網絡來對直升機飛行狀態進行判定,并與提出的改進的可拓神經網絡進行對比分析。對已選擇的400個樣本進行訓練。設定網絡迭代次數epochs為3 000次,期望誤差goal為0.01,學習速率lr為0.01?;谠O定的預測參數,使用同樣的訓練樣本進行訓練學習,直升機飛行狀態可拓神經網絡和BP神經網絡的訓練結果誤差率如圖6所示。
從圖6中可以發現:紅線表示可拓神經網絡的誤差率下降趨勢,藍線表示BP神經網絡下降趨勢。在訓練次數較少時,BP神經網絡的錯誤下降率比可拓神經網絡要快,表現更佳;當訓練次數增多時,可拓神經網絡的下降速率表現比BP神經網絡更好,可拓神經網絡在訓練次數達到80次左右時可收斂到0.01,而BP神經網絡在130次左右才可收斂到0.01,二者在多次訓練后也都能達到較高的準確率。因此,在直升機飛行狀態評估時可拓神經網絡相較于BP神經網絡表現更佳。
提出了一種基于改進可拓神經網絡的復雜機械產品運行狀態預測分析模型,通過建立運行狀態預測分析物元模型、可拓神經網絡結構以及可拓預測實現算法等,實現對復雜機械產品運行狀態的預測,可較好解決運行狀態預測分析的準確率較低、推理時間較長、難于分析等問題。同時,所給出的模型和算法對于復雜機械產品運行狀態預測分析數據的表述和理解更加完善,且模型訓練次數相對較少,模型精度較高,對運行狀態的判定更加準確。具體案例與算法對比分析結果表明,本文中給出的改進可拓神經網絡的復雜機械產品運行狀態預測分析模型具有可行性和有效性。