王彥快,米根鎖,張 玉,王宇峰,王朋雨
(1.蘭州交通大學 鐵道技術學院,甘肅 蘭州 730070;2.蘭州交通大學 自動化與電氣工程學院,甘肅 蘭州 730070;3.國網甘肅省電力公司 電力科學研究院,甘肅 蘭州 730070;4.國網甘肅省電力公司 定西供電局,甘肅 定西 743000)
隨著中國高速鐵路(以下簡稱“高鐵”)的快速發展,對列車的運營安全和效率提出了更高的要求,也隨之給鐵路信號設備的運營維護帶來更大挑戰。道岔作為鐵路信號設備中最關鍵的基礎設施之一,其故障數約占鐵路信號設備故障總數的40%以上,其中90%以上為機械故障[1]。因此,對道岔狀態進行監測,及時掌握其當前健康狀態,并制定合理的維修策略,是減少道岔故障、提高其可用性的重要手段。
目前我國鐵路現場主要采用“計劃修”和“故障修”相結合的道岔維護模式:維護人員通過信號集中監測系統(Combined Signal Monitoring,CSM)監測道岔實時狀態,定期瀏覽道岔轉轍機動作電流、功率曲線等參數,周期性地對現場運行中的道岔進行檢測與維護,確保道岔工作狀態良好;當道岔發生故障報警后,結合CSM的監測數據,依據專業知識和工作經驗定位道岔故障類型,輔助維修。該維修方式下,故障診斷準確率較低,勞動強度較大,且易造成“欠維修”和“過維修”,其維修存在局限性[2]。
為改變現有道岔維修方式,國內外學者從道岔故障診斷和設備退化兩方面開展了相關研究。道岔故障診斷是對已故障道岔定位其故障類型,而對潛在故障或故障趨勢并未涉及,無法完成道岔“故障修”向“狀態修”的轉變。設備退化方面,文獻 [3]采用SOM-BP混合神經網絡方法對道岔設備退化狀態進行識別,準確率達到95.56%;文獻 [4]通過Hausdorff距離分別計算道岔電流、功率曲線與正常曲線之間的相似度,實現道岔健康狀態評估及故障檢測,解決了現有故障診斷方法需要大量樣本數據對算法支撐的問題;文獻 [5]建立基于SVDD的道岔轉換故障檢測和健康指標評估模型,實現對道岔設備的健康管理。上述文獻均為道岔狀態退化研究提供了有力依據,但是原始道岔曲線樣本數據中的正常數據和異常數據數量比例不平衡,而且采用的特征指標選取及處理方法無法全面反映出道岔的故障特點及趨勢。
針對以上問題,本文以我國高鐵大量采用的ZDJ9型電動轉轍機為例,從CSM中獲取道岔功率曲線,包括道岔正常轉換功率曲線、不同退化狀態下的道岔功率曲線和道岔故障功率曲線,建立道岔功率曲線樣本數據庫;提取樣本數據的時域、頻域、經驗模態分解(Empirical Mode Decomposition,EMD)奇異值熵等三方面的特征值,組成樣本數據的特征向量,并采用核主成分分析(Kernel Principal Component Analysis,KPCA)法對高維特征指標進行選擇與處理,構建道岔特征指標樣本數據庫;建立道岔退化狀態劃分連續隱馬爾可夫模型(Continuous Hidden Markov Model,CHMM),將退化特征樣本數據劃分為不同的退化狀態,并在此基礎上,構建麻雀搜索算法(Sparrow Search Algorithm,SSA)優化支持向量機(Support Vector Machine,SVM)算法的道岔設備健康狀態評估模型,實現道岔健康狀態的綜合評估;最后驗證提取道岔功率曲線樣本數據的時域、頻域、EMD奇異值熵三方面特征指標,以及采用KPCA降維方法的合理性;分別與使用GridSearch-SVM、GA-SVM、PSO-SVM算法建立的道岔設備健康狀態綜合評估模型的評估結果進行對比,驗證基于CHMM和SSA-SVM的高鐵道岔設備健康狀態評估方法的可行性和精準性。
在現場通過CSM監控并記錄道岔轉換過程中的有關數據,實時掌握道岔動作過程中轉轍機的電流曲線和功率曲線等參數,其中功率曲線不僅能夠反映道岔轉換時的電氣特性,更能體現道岔在動作過程中所受阻力大小和機械性能[6]。為此,本文選擇功率曲線數據建立樣本數據庫。
在CSM中,通過道岔監測模塊監測到的道岔正常轉換功率曲線見圖1。圖1中,道岔轉換過程功率曲線分為解鎖、轉換、鎖閉等3個階段。在解鎖過程中,1道岔啟動繼電器(DQJ)勵磁吸起,道岔動作曲線開始記錄,2DQJ轉極,功率曲線驟然產生尖峰,尖峰值為650~1 080 W,道岔啟動電路接通,道岔動作開始;在轉換過程中,功率曲線較平滑,功率值大小與參考曲線大體相同;在鎖閉過程中,當動作的尖軌密貼于基本軌,道岔鎖閉后,自動開閉器接點轉換,同時斷開啟動電路,接通表示電路,斷相保護器無電流通過,使保護繼電器落下,又因1DQJ處于緩放狀態,啟動電路仍有兩相電流,產生200 W左右的曲線小臺階,直到1DQJ緩放結束,功率為0 W[7]。

圖1 道岔正常轉換功率曲線
通過分析道岔轉換功率曲線,結合現場道岔故障原因及設備退化規律,將道岔全生命周期的整個狀態劃分為正常狀態、退化狀態和故障狀態3個等級。道岔全壽命周期狀態曲線見圖2。由圖2可知,在正常狀態下,設備運行正常,狀態監測值在正常范圍,故障發生概率較低;在故障狀態下,設備性能惡化,已發生故障,必須及時安排檢修;從道岔正常狀態的退化起始點開始至故障點的生命周期為退化狀態,表現在道岔轉換功率曲線上,雖然解鎖、轉換、鎖閉3個過程曲線完整,但是往往表現出功率幅值、波動幅度、動作時間等不同的退化特點,所以需要及時精準地評估出當前道岔狀態,以提醒維修人員采取相應的維修措施。

圖2 道岔全壽命周期狀態曲線
高鐵道岔設備健康狀態評估的技術路線見圖3。圖3中,整個過程主要包括:道岔特征指標樣本數據庫的建立、道岔退化狀態劃分CHMM模型構建、道岔健康狀態評估SSA-SVM模型構建,以及高鐵道岔設備健康狀態評估功能實現。

圖3 高鐵道岔設備健康狀態評估的技術路線
為更全面反映道岔功率曲線具有的退化及故障特征,結合道岔轉換過程中解鎖、轉換、鎖閉等3個過程的功率曲線特點,分別提取每個過程的時域、頻域、時頻域特征指標。
2.1.1 時域特征指標提取
由于不同的道岔故障類型在道岔功率曲線的解鎖、轉換、鎖閉過程中的表現具有不同的特點,故需要分別提取以上3個過程的時域特征指標,見表1[8]。

表1 時域特征指標
2.1.2 頻域特征指標提取
通過分析道岔典型故障功率曲線的特點得出故障現象表現在功率曲線的某個小區域,若僅僅計算時域特征指標,可能會忽略功率曲線的故障小區域,而在功率信號的頻譜中,頻率分量會相應地改變。假設一個道岔功率曲線數據樣本序列為{pf},經快速傅里葉變換(FFT)后得到的幅值序列為{Af},相角序列為{θf},其中f∈[1,160]。每一個道岔功率曲線數據樣本需提取的頻域特征指標見表2[9]。

表2 頻域特征指標
2.1.3 時頻域特征指標提取
為全面反映道岔功率曲線的非線性信號特征,利用EMD分解道岔功率曲線得到特征向量矩陣,基于奇異值分解和信息熵理論構建奇異值熵作為時頻域特征指標[10]。該方法不僅能夠有效提取故障信號微弱的特征,而且不需選取基函數,具有自適應性較強等優勢。
1)EMD方法及特征向量矩陣
將道岔功率信號x(t)中曲線數據的波動或道岔退化趨勢逐級分解,得到由多個本征模態函數(Intrinsic Mode Function,IMF)分量xd(t)和一個余項r組成的表達式,即
( 1 )
xd(t)為x(t)中從高頻到低頻不同頻段的成分,由于在每一個IMF分量中又包含道岔功率信號中突變的故障信息,所以可由n個IMF分量組成的初始特征向量矩陣C表示x(t)的特征,即
( 2 )
2)奇異值熵[12]
根據奇異值分解原理可得
C=UΛVT
( 3 )
式中:U、V分別為(n+1)×(n+1)階、m×m階正交矩陣,m為每個IMF分量的數目;Λ為對角矩陣,主對角元素λ1、λ2、…、λ(n+1)為矩陣C的奇異值,且滿足λ1≥λ2≥…≥λ(n+1)≥0。
設gd、vd分別為U、V的列向量,則式( 3 )可等效為
( 4 )
式中:λd為矩陣C的第d個奇異值。為定量描述信號時頻成分和復雜度,引入奇異值熵Y,其定義為
( 5 )

由于通過計算原始道岔功率曲線的時域、頻域、EMD奇異值熵組成的高維特征指標向量,其特征指標之間存在大量的冗余數據和空間相關性,在模型訓練時,復雜度較高,穩定性較差,故本文選用KPCA對道岔高維特征指標進行選擇處理。具體實現過程為:采用非線性映射核函數將樣本數據映射在高維特征空間,進行零均值處理后得到新核矩陣;計算新核矩陣的特征值、特征向量以及方差貢獻率,按照從大到小的順序排列,并對方差貢獻率歸一化;將樣本點投影在特征向量上,根據累計目標方差貢獻率的大小提取前幾個主成分,從而建立道岔特征指標樣本數據庫[13]。
假設道岔退化特征指標樣本序列為O=(o1,o2,…,oT),對應的道岔退化狀態序列為q=(q1,q2,…,qT),基于CHMM的道岔退化狀態確定訓練模型ρ[14]為
ρ=(k,h,π,A,B)
( 6 )

根據式( 6 ),道岔退化狀態CHMM劃分模型的構建步驟如下:
Step1CHMM模型訓練。采用Baum-Welch算法,該算法是采用最大期望算法的原理,通過極大似然對數值反映訓練模型與實際模型的接近程度,其值越大越接近。具體實現過程為:不斷迭代訓練參數,每一步迭代分為求期望和極大化2個步驟,直到CHMM模型收斂,保存最優參數。
Step2退化狀態數確定。為確定道岔退化狀態等級,通過已知的道岔退化特征指標樣本序列和已訓練好的CHMM模型,采用Viterbi算法找到一個合理的隱狀態序列解釋該觀測序列。
Step3當前退化狀態確定。采用前向-后向算法計算觀測序列在給定CHMM模型下的似然概率值lg(P(O|λ)),并比較各模型下的似然概率值,確定所有樣本所屬退化狀態。
以上涉及到的Baum-Welch、Viterbi、前向-后向算法的詳細推理過程見文獻 [15]。
為能夠準確地對高鐵道岔設備健康狀態進行評估,本文在對道岔退化狀態劃分的基礎上,建立基于SVM算法的道岔設備健康狀態評估模型。SVM算法在解決小樣本、非線性、模式識別等問題方面具有很大優勢,符合道岔設備狀態評估特點,同時考慮到SVM模型的泛化能力受懲罰因子c和核函數半徑g的影響較大[16],故本文引入SSA算法優化SVM模型中的參數c和g,以提高SVM的評估準確率。
SSA算法由Xue和Shen在2020年提出,是一種新型群體智能優化算法[17],通過模擬麻雀覓食與反捕過程獲得最優參數c和g,與其他群體智能優化算法相比,該算法全局搜索能力強,收斂速度快,精度高,而且穩定性好。
SSA算法的實現原理為:將在覓食過程中的麻雀分為發現者、加入者和偵察者3種類型,通過利用它們之間的關系及麻雀在遇到捕食者之后的反應而達到優化搜索的目的[17-18]。

1)發現者的位置更新
發現者搜索能力強,可引導整個種群搜索和覓食。發現者的位置更新式為
( 7 )
式中:t為當前迭代次數;N為最大迭代次數;α為(0,1]之間的隨機數;G為服從正態分布的隨機數;L為1×j維、元素均為1的矩陣;R2為預警值,R2∈[0,1];SN為安全值,SN∈[0.5,1]。
當R2 2)偵查者的位置更新 偵查者通過監視發現者以提高自身捕食率,當遇天敵威脅時,發出預警信號,種群做出反捕食行為。偵查者的位置更新式為 ( 8 ) 式中:Xg為當前全局最優位置;β為步長調整參數,為服從均值為0、方差為1的正態分布的隨機數;K為麻雀移動方位,K∈[-1,1];fw為全局最差適應度;fg為全局最優適應度;fi為i個體的適應度;ε為最小常數,以避免分母為零。 當fi≠fg時,表示該麻雀在種群的邊緣帶活動,易被捕食者發現而受到襲擊;當fi=fg時,表示該麻雀位于種群的中心位置,且已察覺到被襲擊的危險,需要迅速向其他區域的麻雀靠攏。 3)跟隨者的位置更新 除發現者和偵查者之外,其余的麻雀均為跟隨者,主要通過跟隨發現者搜尋食物以獲得更好的適應度。跟隨者的位置更新式為 ( 9 ) 式中:Xw為全局最差位置;Xp為全局最優位置;A為1×j維矩陣,各元素隨機賦值為1或-1,且滿足A+=AT(AAT)-1。 當i>n/2時,表明第i個跟隨者未搜索到食物,存活率低,需前往其他區域搜尋食物,以提高自身適應度。 SVM算法原理見文獻 [19]。采用SSA算法優化SVM狀態評估模型的參數c、g的流程見圖4。評估模型的優化步驟如下: 圖4 評估模型的優化流程 Step1初始化SSA參數。 Step2通過計算個體適應度fi,選出最優適應度fg和其所對應的位置X(c,g)。 Step3選取分類錯誤率最小的適應度函數,計算得到適應度,并按從大到小的順序選取前pNum只麻雀(占種群數量的60%~70%)作為發現者,根據式( 7 )更新發現者的位置;隨機選取sNum只麻雀(占種群數量的5%~10%)作為偵查者,根據式( 8 )更新偵查者的位置;其余均為跟隨者(占種群數量的15%~20%),根據式( 9 )更新跟隨者的位置。 Step4根據麻雀種群當前的狀態,更新整個種群所經歷的最優位置X(bestc,bestg)和最優適應度fg,訓練SSA-SVM模型。 Step5判斷算法運行是否達到收斂條件,若是,循環結束,將最優結果X(bestc,bestg)輸入SVM狀態評估模型;否則返回Step2。 以某鐵路局管轄車站采用的ZDJ9型電動轉轍機所驅動的道岔為研究對象,共獲取344條道岔功率曲線,其中包含254條不同退化狀態下的道岔功率曲線、50條道岔正常轉換功率曲線以及40條道岔故障功率曲線。道岔正常轉換的時間為6 s左右,采樣間隔為40 ms,采樣點數為150。在做數據處理時,在曲線數據點后補零至時間點為6.4 s,若故障動作時間超過6.4 s,則截取曲線前6.4 s的數據,最終每條功率曲線采集160個數據點組成一個樣本。其中,解鎖過程為0~0.6 s,共采集15個數據點;轉換過程為0.64~4.4 s,共采集96個數據點;鎖閉過程為4.5~6.4 s,共采集49個數據點。 1)時域特征指標提取結果分析 根據表1中列出的16個時域特征指標,分別計算344個道岔功率曲線樣本解鎖、轉換、鎖閉過程的時域特征指標。由于不同的道岔退化及故障狀態在3個過程的功率曲線表現出不同的特點,部分時域特征指標對退化類型的分析并不敏感,例如所有樣本的峭度因子值區分度不大,每個階段的平均值與絕對平均值數值存在相似性,所以需要對各項指標的變化趨勢以及指標間的關系進行分析。最終選出解鎖過程14個指標(刪除最小值、峰峰值、峭度指標,增加最大值與第15個采集點數據的差值)、轉換過程15個指標(刪除峭度指標)、鎖閉過程17個指標(增加最大值與最小值的差值),建立344×46維的時域特征指標。 2)頻域特征指標提取結果分析 根據表2所示的頻域特征指標,對344個道岔功率曲線樣本數據采用FFT變換得到功率曲線的各段頻譜,提取12個頻域特征指標。由于最大相角、能量特征指標對退化及故障狀態不敏感,需刪除,最終建立了344×10維的頻域特征指標。 3)時頻域特征指標提取結果分析 以圖1所示的道岔正常轉換功率曲線數據為例,EMD分解后的前4個IMF分量波形見圖5。由圖5可見,道岔功率信號細微的變化經過EMD分解后,隨著頻率由高到低減小,信號能量依次減弱。 圖5 道岔正常轉換功率曲線數據EMD分解結果 通過對IMF分量進行信號重構并進行奇異值分解,結合信息熵理論計算344組道岔功率曲線樣本的EMD奇異值熵,繪制出EMD奇異值熵散點,見圖6。由圖6可見,由于采集數據來源于不同組的道岔,而且道岔健康狀態不同,信號的復雜程度不同,其EMD奇異值熵區分明顯。 圖6 EMD奇異值熵散點 通過計算道岔功率曲線樣本數據的時域、頻域、EMD奇異值熵特征指標,并對其進行初步選擇后,建立344×57維的特征指標樣本。對樣本數據標準化后進行KPCA降維,選取累計方差貢獻率大于95%作為目標降維量選取的標準,其中8維能夠代表87.78%以上的原始信息,11維能夠代表約92.12%以上的原始信息,16維可代表95.62%以上的原始信息,故前16個主成分即可滿足要求。經KPCA降維后的16個主成分的貢獻值散點見圖7。由圖7可見,第1主成分對應的貢獻最大,從第1主成分至第16主成分的貢獻依次減小。 圖7 16個主成分的貢獻值散點 1)道岔退化狀態區段劃分模型構建 采用道岔退化狀態下功率曲線的特征指標樣本訓練CHMM模型,其中訓練樣本的道岔退化狀態,是在研究典型道岔故障類型的基礎上,在CSM中調取已故障道岔從正常工作到發生故障期間的多組功率曲線,根據該道岔的工作時長以及道岔從退化至完全發生故障的時長,并結合道岔維修記錄和現場專家經驗等設置的。參考文獻 [3]中的研究成果,將隱含狀態數目Q設置為5~8,采用Viterbi算法進行解碼,將254×57維的退化特征樣本數據劃分為不同的區間范圍。隱含狀態的劃分見圖8。 圖8 隱含狀態的劃分 由圖8可見,當Q=5、7、8時,區段劃分結果出現交叉重疊的現象,說明這部分數據可以劃分到2個區段,顯然對道岔實際退化狀態的劃分不符合實際情況;而當Q=6時,254組退化樣本被劃分到6個不同的區段,能夠很好地反應出道岔性能由輕微退化到嚴重退化的整個規律,同時也驗證了文獻 [3]的結果。254組退化樣本數據劃分結果見表3。 表3 254組退化樣本數據劃分結果 2)道岔退化狀態分析 結合表3中列出的254組退化樣本數據劃分結果,分別選取每一級退化狀態下的第一個樣本,繪制出完整的道岔功率曲線,見圖9。結合現場調研情況,總結出該6種典型退化類型道岔功率曲線特點,見表4。 表4 道岔設備典型退化類型 圖9 6種典型道岔退化狀態功率曲線 5.5.1 參數優化 在Matlab中,初始化SSA參數,設置最大迭代次數為100,種群數量為20,c、g的優化范圍均為[1×10-5,1×103],交叉驗證折數為5,安全值為0.6,發現者所占比例為70%,加入者所占比例為20%,偵查者所占比例為10%;在由道岔正常、退化、故障等共8種狀態組成的344×16維樣本中,抽取每一種狀態的后10組樣本組成80×16維的測試樣本,其余264×16維樣本為訓練樣本。結合圖4以及4.2節的優化步驟,采用SSA算法優化SVM的懲罰因子c和核函數半徑g,最終得到最優參數X(bestc,bestg)為X(22.732 1,0.391 98),最佳適應度fg高達98.75%。該模型的最佳適應度曲線和平均適應度曲線見圖10。 圖10 最佳適應度曲線和平均適應度曲線 5.5.2 狀態評估模型測試 將最優參數X(22.732 1,0.391 98)輸入至SSA-SVM狀態評估模型中,得到80×16維測試樣本的實際狀態和評估狀態,見圖11。圖11中,縱坐標1~6分別為表3中的道岔退化狀態Ⅰ~Ⅵ級,縱坐標7、8分別為道岔正常狀態和道岔故障狀態。由圖11可見,SSA-SVM的評估模型中,80組測試樣本中僅有1組數據出現錯誤,道岔健康狀態識別正確率達到98.75%,退化狀態識別正確率達到98.33%,高于文獻 [3]中基于SOM-BP算法模型的道岔退化狀態識別結果。 圖11 測試樣本的實際狀態和評估狀態 5.5.3 狀態評估結果分析 1)分別采用264×160維道岔功率曲線數據訓練樣本、降維前的264×57維特征指標訓練樣本以及經KPCA降維后的264×16維特征指標訓練樣本訓練SSA-SVM模型,并輸入對應樣本的80組測試樣本進行評估,3種樣本的道岔健康狀態評估結果見表5。 表5 3種樣本的道岔健康狀態評估結果 由表5可見,3種樣本的道岔狀態評估結果表明,經KPCA降維后的樣本具有較高的評估準確率,而且模型訓練時間最短,滿足對道岔設備健康狀態評估實時性的要求;同時驗證了提取道岔功率曲線樣本數據的時域、頻域、EMD奇異值熵等三方面特征指標,以及采用KPCA降維方法的合理性。 2)采用264×16維特征指標訓練樣本分別訓練GA-SVM、GridSearch-SVM、PSO-SVM 等3種方法的高鐵道岔設備健康狀態評估模型,采用80×16維特征指標測試樣本進行評估,并與本文方法進行對比,4種評估模型的道岔健康狀態評估結果見表6。 表6 4種評估模型的道岔健康狀態評估結果 % 表6評估結果表明:在獲得最佳優化參數的前提下,4種評估模型中SSA-SVM模型的健康狀態評估準確率最高,其中正常、故障狀態的評估準確率均為100%;6種退化狀態下,Ⅰ、Ⅱ、Ⅲ易出現錯誤識別,Ⅳ、Ⅴ、Ⅵ的識別正確率均為100%。分別統計4種模型中錯誤識別的樣本,第25個樣本均出現錯誤評估,該樣本分類后屬于F3類退化狀態Ⅲ,而錯誤評估為F2類退化狀態Ⅱ,結合表4,對比F2和F3,這兩類退化狀態均由道岔轉換過程阻力異常引起,表現在道岔功率曲線上,轉換過程出現了功率“鼓包”,只是出現功率異常的時間點有所不同,這也是易出現錯誤識別的主要原因。針對以上問題,在今后的研究工作中,可以嘗試其他算法提高道岔退化狀態劃分的精度,達到提高道岔狀態評估準確率的目的。 1)本文通過計算功率曲線數據的時域、頻域、時頻域三方面特征指標,全面提取了道岔退化及故障特征,其中時頻域特征指標采用EMD奇異值熵,不僅能夠有效提取故障信號微弱特征,而且不需選取基函數,具有自適應性強等優勢,獲得了道岔的不同退化狀態下的特征指標。 2)采用KPCA方法對道岔特征指標進行選擇處理,消除了原始多維特征冗余信息,減少了模型訓練時間,提高了道岔設備健康狀態評估的實時性。 3)構建退化狀態劃分CHMM模型,將道岔退化過程劃分為6個退化狀態,較好地表征了道岔設備退化演變過程。 4)分別構建基于GA-SVM、GridSearch-SVM、PSO-SVM、SSA-SVM的道岔設備健康狀態綜合評估模型,輸入測試樣本,對比退化狀態Ⅰ至退化狀態Ⅵ、道岔正常狀態、故障狀態的評估準確率,驗證了基于CHMM和SSA-SVM的高鐵道岔設備健康狀態評估方法的高評估準確率和可行性,為道岔設備日常維護、故障及時發現處理、維護維修計劃制定提供一定的理論依據。4.2 SSA-SVM模型

5 高鐵道岔設備健康狀態評估方法實現
5.1 道岔功率曲線樣本數據庫的建立
5.2 道岔特征指標提取結果分析


5.3 基于KPCA變換的道岔特征指標選擇及結果分析

5.4 道岔退化狀態劃分CHMM模型的構建及結果分析




5.5 道岔健康狀態評估SSA-SVM模型的構建及結果分析




6 結 論