黃天雄,董 懿,孔令超,李初輝,楊 賽
(中國長江電力股份有限公司,湖北 宜昌 443000)
閘門是水壩或水閘中用于控制水流的可開啟或關閉的大門或閥門,其作用是控制水位、水流量以及防洪[1,2]。在閘門運行的過程中,會因其處在不同情況下,受到不同程度的振動。對振動信號分析可以進行有效的控制或采取有效的措施處理消除強烈振動[3,4]。目前較為常見的分析振動信號的方式有變模態分解,趨勢預測方法包括回歸模型、神經網絡等。錢林 等為了提取軸承信號頻率的特征,采用一種基于VMD的自適應形態學,對原有的頻率進行分解,從而有效提取故障信號的特征頻率[5]。但是由于閘門信號的復雜性,以及對噪聲的敏感性,單分析分解后的模態,對閘門信號判斷是遠遠不夠的。由于近代神經網絡的發展,機器學習可以有效的提升對信號判斷的魯棒性和準確性。楊晶顯 等在VMD分解基礎上,采用LSTM網絡,它可以關聯挖掘輸出與相關輸入變量之間的空間和時序,從而顯著的提高預測的準確性[6]。王軍 等在LSTM網絡結構上,融合了SSA算法,SSA算法可以優化LSTM的超參數,相比LSTM網絡結構,SSA可以對時間序列分解,提高了數據的純凈性和穩定性[7],提高預測的準確性。綜上所述,結合上述算法的優點,本文提出了一種基于VMD和SSA-LSTM的閘門信號分析算法,采用VMD算法對閘門振動信號進行模態分解,將分解的模態輸入SSA-LSTM網絡,得出信號預測的結果,實現對閘門振動信號高效的分解和有效的預測。
本文采用VMD變分模態分解算法,并且融合了SSA群智能優化算法[8]和LSTM神經網絡[9]框架進行預測。本文使用VMD算法將振動信號分解成5種不同頻率和振幅的模態分量。將經過分解的信號輸入進LSTM模型中。SSA會優化LSTM的超參數,SSA的目標函數是未經訓練的LSTM模型在訓練數據上的預測誤差,SSA通過迭代搜索過程來優化LSTM的超參數,直到達到參數配置或收斂。LSTM將學習每個模態分量的時序模式,并使用這些信息進行預測。其流程如圖1所示。

圖1 VMD-SSA-LSTM算法流程圖
VMD算法通過迭代搜索變分模型的最優解,以確定每個固有模態分量(BLIMFS)的中心頻率和帶寬,從而實現信號從低頻到高頻的有效分離。假設每個模態具有特定的中心頻率和有限的帶寬。尋找K個模態,使每個模態的估計帶寬之和最小,約束條件是各模態的和等于輸入信號f。其模型為:
其次,對構造的變分問題求解。二次懲罰因子確保信號在噪聲環境下的重構精度,拉格朗日懲罰算子增強約束。通過引入二次懲罰算子α和拉格朗日懲罰算子λ(t),將問題轉換為非約束性變分問題,公式如下:
采用傅里葉等距變換,可將式(3)轉換到頻域,解得:
VMD的算法具體過程如下所示[8]:
(2)根據式(4)和式(5)在頻域內更新uk、ωk;不斷更新λ;
SSA-LSTM模型主要步驟如下:
(1)SSA參數設置:首先,初始化麻雀種群的參數,包括數量、初始位置、最優位置、全局最優適應度等。接下來,根據適應度函數對麻雀的位置進行評估和排名。
(2)搜索空間初始化:根據麻雀數量和優化參數(神經元數量、迭代次數、輸入批次和學習率)構建搜索空間矩陣,并初始化相關參數。同時,確定最大迭代次數。
(3)參數更新:發現者、參與者和偵察者的位置根據條件(1)到(3)進行更新,并應用邊界函數來限制所需的LSTM超參數。
(4)適應度評估:使用適應度函數評估更新后的位置,以確定適應度最好和最差的個體。如果麻雀本次迭代的最佳適應度超過全局最佳適應度,則更新全局最佳適應度及相應參數;否則,保持它們不變。
(5)停止條件檢查:檢查是否滿足預定義的誤差以及達到最大迭代次數的停止條件。如果滿足條件,指定全局最優的超參數集作為LSTM參數;如果不是,則返回步驟(3)。
LSTM 是循環神經網絡 (RNN) 的一種變體,用于處理時間序列數據。它在傳統的循環神經網絡(RNN)基礎上引入了記憶單元和門控機制來精確控制信息的傳遞。一般來說,門控機制的通用形式可以表述為:
LSTM的單元結構如圖2所示:

圖2 LSTM單元結構圖
式中,σe(x)是Sigmoid函數,即非線性激活函數。其他參數的計算公式為:
式中,W為權重矩陣,b為網絡的偏置向量,tanh為雙曲正切函數,它的輸出在-1到1之間,i、f、O分別表示輸入門、遺忘門和輸出門,LSTM隱藏層的輸入和輸出向量在時間t的時刻分別為xt和ht,記憶單元為Ct。
SSA(Sparrow Search Algorithm,麻雀搜索算法)是一種新型的群體智能優化算法,其靈感源自麻雀在覓食和反捕食行為中的表現。SSA的核心概念在于模擬了麻雀群體覓食的過程,其中每只麻雀具有三種可能的行為策略:發現者(搜索食物)、加入者(跟隨發現者尋找食物)、偵察者(警戒偵查)。發現者代表麻雀群體中最早找到食物的個體。加入者代表隨著發現者一同尋找食物的麻雀。麻雀的位置矩陣表示為:
式中,n是麻雀的數量,d是需要優化的參數的數量。那么,所有麻雀的適應度值,即健康程度可以用以下向量表示:
式中,FX中的每一行的值表示每個麻雀的適應度值。
在麻雀搜索算法中,因為生產者擁有更高的能量儲備,并且負責種群中主要的覓食任務。因此,生產者可以比搜索者在更廣的范圍內覓食。在每次迭代過程中,生產者的位置更新為:
式中,t表示當前迭代的次數,表示第i只麻雀的第j維度值,itermax是總迭代次數值,R2是一個0到1的隨機數,表示鳴叫值,ST是0.5到1的值,代表安全閾值,Q是服從正態分布的隨機數,Ub和Lb是值設定的上限和下限。
當周圍沒有捕食者時,即R2
式中,XP表示生產者占據的最佳位置,W表示服從平均值為0標準差為5的正態分布的隨機數,E表示服從平均值為0標準差為0.1的正態分布的隨機數,i>N/2表示第i只麻雀健康值較差很有可能處于饑餓的狀態。
為了驗證本文算法,采集某水電站弧形閘門振動信號,利用開關過程中的振動數據進行預測和趨勢分析。采集首先采用VMD對采集的振動信號進行分解,在VMD分解過程中,二次懲罰算子α和VMD分解模態數K是需要確定的,α的經驗值為2 500,K為5。從圖3中可知,IMF1獲得了信號的基本的變化趨勢,IMF2-IMF5提取了更高頻率的信號成分。然后將這些不同頻率成分的模態作為輸入,輸出為振動信號原始數據,利用LSTM進行實時預測。

圖3 IMF1-IMF5的分解效果
分別設計了LSTM、VMD-LSTM和VMD-SSALSTM三種預測算法作為對比試驗組,其中固定LSTM的隱含層個數為70,初始學習率0.01。采用本文提出的SSA-LSTM優化,其中SSA參數為:種群數據為20.迭代次數為10,優化維度為3,分別是LSTM隱含層個數、迭代次數和初始學習率,預警值0.6,發現者的比例0.7,意識到有危險麻雀的比重為0.2。訓練集為70%,驗證集為30%。從圖4a中可知,SSA-LSTM進化曲線均方根誤差不斷減小,直至收斂。優化的參數如下106.5,280.13,0.0086。三種模型的預測誤差結果如圖4b和表1所示,LSTM均方根誤差RMSE(Root Mean Square Error)誤差最大,VMD-LSTM相對較小,本文提出的算法VMD-SSALSTM最小,相比沒有優化算法的結果降低68.1%,趨勢更加接近。

表1 不同算法RMSE

圖4 不同算法結果
采用同樣參數,但是VMD采用8個IMF進行分解,如圖5所示。然后對其進行預測,從圖6(a)中可知,SSA-LSTM進化曲線均方根誤差不斷減小,直至收斂。三種模型的預測誤差結果如圖6(b)所示,LSTM誤差最大,VMD-LSTM相對較小,本文提出的算法VMDSSA-LSTM最小。從上述結果可知,不同的模態分解采用本文優化算法都能很好的獲取最優結果。

圖5 IMF1-IMF8的分解效果

圖6 不同算法優化結果
本文提出一種基于VMD多模態分解和SSALSTM網絡結構,首先采用VMD分解了閘門信號并取得信號特征,通過SSA優化LSTM網絡超參數,利用分解的模態特征預測振動信號數值,提高對閘門信號預測的準確性和效率,為后續振動信號檢測和閘門故障診斷提供技術支持。