高鶴元 甘輝兵 鄭 卓 楊遠達
(大連海事大學輪機工程學院 遼寧 大連 116001)
船舶輔鍋爐用來產生飽和水蒸氣,是保證船舶正常航行的重要設備之一,其主要用于船上油類加熱、主機預熱及提供各種生活用汽[1]。對于蒸汽系統而言,船舶輔鍋爐十分重要。一旦該系統在運行過程中出現故障或在使用和操作中出現問題,會影響船舶運營,甚至有可能降低船舶的收益。而傳統意義上的船舶故障診斷只依靠機艙輪機員的經驗判斷,難免會出現不準確的判斷和決策上的失誤[2]。目前國內外在大型機械故障診斷中多使用BP神經網絡、支持向量機和故障樹等方法[3]。這些方法需要對大量已知故障樣本數據進行學習,以達到預期的準確率,從而實現對未知數據的診斷。但實際上,大部分實驗室條件不足,船舶故障特征信號難以獲得,往往只有正常數據,缺少故障數據,導致有監督學習的研究難以有效開展。
無監督學習分類方法的依據是樣本特征參數與統計決策規則,就是在無任何已知類樣本的前提下,通過分析數據內在結構、樣本相似度、概率密度函數估計等方法對樣本數據實現正確分類[4]。這種方法不需要準確的數學模型,具有較好的自組織學習性和較強的容錯、泛化能力,能夠較好地實現待分類數據的非線性映射[5]。
自組織特征映射(SOM)神經網絡于1987年提出,屬于無導師學習網絡,可以對任意模擬輸入信號進行區域分類[6]。SOM網絡具有向周圍環境學習并通過自我學習改善自身性能的能力,所以無須對大量樣本數據進行訓練,目前在電機系統、轉子系統和污水處理等故障診斷領域均得到了廣泛的運用[7-9]。
為了避免SOM網絡通過“硬競爭”方式選取獲勝神經元導致分類錯誤等問題,本文采用粒子群(Particle swarm optimization,PSO)算法優化SOM更新權值過程,并對船舶輔鍋爐某燃燒工況下的運行數據進行對比分析。仿真結果表明,優化后的算法用于聚類計算時,很好地克服了權值初始化、識別準確率不高等缺點,提高了船舶輔鍋爐燃燒故障診斷的聚類精度,取得了更好的識別效果。
SOM網絡是一種可以進行自組織學習的競爭型神經網絡,自適應學習能力強、魯棒性好。其學習方式與人腦中的生物神經網絡相似,可以自主尋找樣本數據中的本質屬性和內在規律,從而改變自身網絡結構和相關參數[10]。SOM網絡結構簡單,具有良好的非線性擬合性、生物神經元特性和聚類自動性[11]。SOM網絡通過輸出層神經元互相競爭,與輸入向量進行匹配,選擇其中一個最合適的神經元獲勝,然后修正獲勝神經元領域相關的權值向量。SOM網絡結構如圖1所示,其分為下層輸入層和上層競爭層。輸入層輸入初始向量,輸出層的輸出節點之間由權值連接,排成一個節點矩陣,相互激勵或抑制。

圖1 SOM網絡結構圖
其學習算法步驟如下:
(1) 隨機數初始化輸入層與映射層之間的權值Wij。
(2) 把向量X=(X1,X2,…,Xn)輸入給輸入層。
(3) 計算各神經元的權值向量和輸入向量的歐氏距離。
(1)
(4) 選擇使dj最小的神經元作為獲勝神經元,記作j*。
(5) 更新獲勝神經元及其鄰域權值:
Δwij=wij(t+1)-wij(t)=η(t)(xi-wij)
(2)
式中:η(t)是(0,1)上的常數。
(6) 若達到目標要求則算法結束;否則返回步驟(2)。
SOM網絡二維平面上的節點之間依據Kohonen學習規則,學習輸入向量的分布情況和拓撲結構,對獲勝神經元及附近由近及遠的神經元產生由興奮到抑制的影響[12]。若一個神經元的權值與輸入向量模式相差很大,則其可能永遠不會成為獲勝神經元,其權值無法得到任何有效的學習訓練,成為“死神經元”,進而降低網絡計算時的收斂速度與聚類精度[13]。所以SOM網絡對初始權值的設置有較大的依賴性,會影響網絡的收斂速度和學習效果。
粒子群優化算法源于生物群體尋找食物等行為,學習“種群”和“進化”的思想,無須執行選擇、交叉以及變異等算子,通過個體協作與競爭實現復雜空間最優解的搜索[14]。PSO無需神經導數等梯度信息,通過全局尋優,可以簡單實現全局優化[15]。每個粒子的特征用方向、速度和適應度值來表示。適應度值由適應度函數計算得到,用來表示粒子的優劣。假設在可解空間中初始化一群粒子,每個粒子都存在一個優化問題的潛在最優解。優化過程就是粒子逐代搜索,計算適應度值,朝著群體最好的地點和歷史最好的方向移動,尋找最優解[16]。每一代粒子通過跟蹤個體極值和全局極值來更新個體位置。個體極值是指粒子本身所經過位置中適應度值最優的位置,群體極值是指整個種群搜索得到的適應度最優位置。粒子每更新一次位置,就計算一次適應度值,通過比較適應度值更新Pbest和Gbest的位置。
假設在D維空間中存在一個由n個粒子組成的種群X=(X1,X2,…,Xn),其中第i個粒子速度用Vi=(Vi1,Vi2,…,ViD)T表示,該粒子個體極值和群體極值分別為Pi=(Pi1,Pi2,…,PiD)T和Pg=(Pg1,Pg2,…,PgD)T。粒子每次迭代更新自身速度和位置的公式為:
(3)
(4)
式中:ω為慣性權重;k為當前迭代次數;c1和c2是非負常數,稱為加速因子或學習因子;r1和r2是[0,1]上均勻分布的隨機數。
SOM神經網絡與其他競爭型神經網絡算法相比精度較高,收斂速度較快,但是權值的隨機初始化導致網絡環境復雜,影響收斂速度,且對于數據相識度較高的故障類型,識別準確度下降。為了解決上述問題,本文使用PSO算法優化神經網絡,稱為P-SOM算法。算法將SOM神經網絡的權值向量看作一個個粒子,將樣本分類結果與實際分類的誤差率作為適應度函數,迭代過程就是更新權值向量使適應度函數達到最小。通過更新每個粒子的位置來更新每個權值向量。達到一定迭代次數之后,再利用優化后的SOM網絡權值向量尋找獲勝神經元。算法流程見圖2。

圖2 SOM結合PSO的算法流程
具體步驟如下:
Step1將提取的特征樣本集進行數據預處理,對樣本數據進行歸一化后作為神經網絡的輸入。
Step2初始化SOM網絡,獲取初始權值向量,確定SOM網絡結構。
Step3用隨機數初始化種群,同時初始化粒子的速度、位置及個體極值和全局極值。
Step4按式(3)和式(4)跟蹤計算每個粒子的速度和位置,得出個體極值和全局極值,并更新粒子的位置和速度。
Step5將更新后的粒子代入SOM網絡尋找獲勝神經元,計算相應的適應度值。
Step6判斷迭代次數是否達到要求,是則算法結束,否則返回Step4。
船舶航行時,當船舶輔鍋爐出現燃燒故障時,通常是由航行輪機員依據經驗對點火油路、主油路、回油路的燃燒設備逐一進行檢查,清潔更換后分別點火測試,診斷故障。但船舶輔鍋爐的故障種類繁多,引發這些故障的原因繁雜,需要監測的故障點也很多,傳統故障診斷方法很難滿足需求。而且船舶輔鍋爐的工作環境特殊,會對輪機員造成一定的影響,判斷故障時可能會出現失誤。因此,應用神經網絡對輔鍋爐燃燒運行時的數據特征進行分析,智能診斷故障尤為重要。
本文主要對船舶輔鍋爐點火失敗、燃燒過程中熄火、燃燒不穩定等常見燃燒故障進行診斷研究。輔鍋爐點火失敗的原因主要有:點火噴油器機械故障,點火電極積泥或堵塞;主油路供油泵機械故障,燃油未達到指定狀態;控制燃燒電路故障,如供油電磁閥和伺服電動機控制線路短路,線路絕緣層老化、斷路等;供風系統故障;安全保護裝置起作用等。本文以大連海事大學開發的DMSVLCC輪機模擬器的船舶輔鍋爐為研究對象進行實驗研究。DMSVLCC輔鍋爐為大型燃油鍋爐,其仿真模型數據與設計值的誤差在允許范圍之內,滿足精度要求,并已經投入教學使用。其主要技術參數如表1所示,DMSVLCC輔鍋爐低負荷運行界面如圖3所示。

表1 DMSVLCC輔鍋爐主要技術參數
DMSVLCC輔鍋爐燃油簡化系統管路如圖4所示,針對上述輔鍋爐燃燒系統可能出現的常見故障,在DMSVLSS模擬器上設置4種故障。在圖中管路上布置監測點,提取特征參數。在低負荷工況5種運行狀態下分別采集輔鍋爐燃燒系統的12個參數,表2為低負荷工況下DMSVLCC輔鍋爐燃燒系統部分參數及范圍。

表2 燃油系統部分監測點參數
將采集的樣本數據按運行狀態分為5組,每組采集16個樣本數據,樣本號1-16、17-32、33-48、49-64、65-80各為一組,共獲得80個樣本進行聚類試驗。類別依次為正常運行、燃油供給泵磨損、燃油預熱器臟堵、點火油泵故障、風機故障。
考慮到船舶輔鍋爐參數具有不確定性和復雜性,12種特征參數存在較大差異,具有不同的量綱和數量級等特點,所以先對樣本進行歸一化處理,統一將樣本數據映射到[0,1]區間上,去除樣本數據對單位的限制,避免數值過大或過小對網絡計算聚類產生的影響。
樣本數據歸一化之后構成80×12的樣本特征矩陣。為了在不影響原始輸入向量結構與聚類準確度的前提下加快神經網絡的收斂速度,本文采用主成分分析法(PCA)降低原始特征矩陣空間的維數,結果如圖5所示。可以看出,第一主成分對應的貢獻率為74.39%,第二主成分對應的貢獻率為16.96%,第三主成分對應的貢獻率為6.58%,前三個主成分的累積貢獻率可以達到97.94%。所以將原始16維空間降到3維特征空間對特征矩陣的影響較小。由此刪除了多余變量,提升了故障診斷的工作效率。

圖5 主成分對應貢獻率
5組樣本數據經PCA降維后的空間分布如圖6所示。可以看出,第1、4、5組的樣本空間分布趨勢相似,分布空間較為接近,在神經網絡聚類時容易產生錯誤;第2、3組樣本分布遠離第1、4、5組,分布比較集中且更明顯。

圖6 樣本特征分布
將80個輔鍋爐樣本構成未被分類的樣本集合,按上述歸一化和降維后作為SOM神經網絡的輸入進行仿真計算,分別使用SOM和P-SOM進行分析。首先設計SOM神經網絡,即輸入層的神經元為3,隱含層采用二維2×3結構,即隱含層神經元有6個,輸出層神經元個數為5,即要區分的類別數目,神經網絡拓撲函數默認為“hextop”,分類階段學習速率默認為0.9,分類階段學習步長為1 000,學習速率為0.02。經多次測試,當神經網絡迭代次數達到500次時,樣本劃分結果較好。每個神經元獲勝次數,即含有的樣本數如圖7所示。6個隱含層神經元均有勝出,每組獲勝神經元序號如表3所示。結果表明,第4組獲勝神經元與第1組和第5組重復,說明其數據特征類似,導致神經網絡分類不精確。綜上,SOM網絡可以將1、2、3、5組數據明顯區分,但對第4組數據分類時獲勝神經元重復,導致分類混亂。

圖7 SOM網絡聚類結果

表3 優勝節點序號
采用P-SOM方法對樣本數據聚類。PSO算法參數設置原則如下:ω初始值為1;種群迭代次數為200,每代SOM網絡的迭代次數設置為200次,種群規模為4,加速因子c1為1.5,c2為2.5。計算后5組樣本數據的分類結果如圖8所示,神經元獲勝結果如圖9所示。可見,P-SOM算法使每組樣本數據都產生了明顯區分,第4組數據被有效識別,單獨區分出來,只存在一個樣本數據被錯誤分到第5組,其他神經元沒有重復獲勝,準確率可以達到98.75%。與SOM對比,P-SOM較好地解決了SOM網絡在激活神經元的選擇上依賴初始權值而導致的一部分數據特征相似的樣本激活相同神經使故障診斷分析精確度下降等問題。

圖8 P-SOM網絡的聚類結果

圖9 SOM網絡優勝節點個數
綜上所述,經過PSO優化的SOM 算法的輸出誤差遠小于未被優化SOM的輸出誤差,即本文提出的P-SOM算法在模式識別過程中具有更高的聚類精度和更快的收斂速度。
本文提出一種基于PSO優化SOM神經網絡的無導師式學習方法,闡述了SOM神經網絡及PSO算法的結構及特點,并利用大連海事大學研發的大型油船輪機模擬器DMSVLCC提取船舶輔鍋爐的數據樣本進行分析處理,詳細闡述了P-SOM算法流程及使用方法。P-SOM借助粒子群算法全局迭代尋優的特性,學習神經網絡權重,改變了SOM原有的Kohonen學習規則,克服了神經網絡依賴初始化權值導致類簇無法有效區分的問題,從而有效地識別出船舶輔鍋爐的故障類型。通過與單一的SOM神經網絡分類進行實驗對比,結果表明:本文方法分類準確度較高,合理可靠,為船舶輔鍋爐燃燒故障診斷提供了一種新的思路,擴充了船舶輔鍋爐燃燒故障診斷的內涵與功能。