萬 樂
(煙臺工程職業技術學院)
電力系統是現代社會的重要組成部分,它們依賴于復雜的輸電變電設備網絡來保障能源的分配和傳輸[1]。因此,對輸電變電設備的可靠性和穩定性提出了更高的要求。為了實現這一目標,電力行業正在積極探索基于云平臺的故障率預測技術[2]。云平臺提供了強大的計算和存儲資源,可處理大規模數據,實現實時監測和預測。
云平臺在電力行業中的應用已取得顯著進展[3]。它可用于數據存儲、實時監測、分析和可視化。通過將傳感器數據上傳到云平臺,操作人員可遠程監控設備狀態。云平臺還可存儲歷史數據,用于故障率預測模型的訓練和改進。
為了進行故障率預測,首先定義一組傳感器觀測變量,這些變量包括電流、電壓、溫度、濕度等。數據采集過程可表示為:
式中,N是采樣點的數量;t是時間戳。這些采樣的原始數據包含噪聲和異常值,因此需要進行數據清洗和預處理。
數據清洗的目的是檢測和修復異常值,以確保數據的質量和可用性[4]。異常值的檢測和表示如下:
(1)計算觀測變量Xi的均值μi和標準差σi,計算如下:
(2)設置異常值的閾值為α,隨后定義異常值的界限。異常值可表示為以下條件:
若某個數據點Xi(t)k超過上述條件的閾值,則被視為異常值。這些異常值代表數據中的錯誤、干擾或設備故障等問題。一旦檢測到異常值,可刪除這些異常值,以確保數據的準確性和可信度。
在數據清洗之后,進行數據預處理,包括平滑、插值和特征工程。
2.3.1 數據平滑
在數據平滑中,本研究使用滑動窗口法進行平均濾波,其中M表示窗口的大小。平均濾波可以表示為:
式中,Xi(tk)是經過平滑后的觀測值,Xi(tk-j)是原始觀測值。經過平滑后的數據可減少數據的波動,使其更適合用于后續的分析。隨后,進行數據插值以確保數據的連續性。
2.3.2 數據插值
數據插值用于填補缺失的數據點,以保持時間序列的完整性。本研究使用線性插值填補缺失的數據點。線性插值是一種常見的方法,它通過使用相鄰時間點的觀測值來估算缺失數據點,可用公式表示為:
2.3.3 特征工程
最后,進行特征工程,提取統計特征,以便用于故障率預測模型。統計特征包括平均值、方差、偏度和峰度。這些特征有助于模型捕捉數據的分布和趨勢,同時也可用于檢測異常情況。
特征工程為模型提供了有用的信息,幫助模型更好地理解數據。經過這些數據預處理步驟,得到經過平滑、插值和特征工程處理后的數據,這些數據可以用于訓練故障率預測模型,提高預測的準確性和可信度。
深度前饋神經網絡(FNN)可自動學習和捕捉數據中的復雜模式和關聯,從而提供準確的設備故障率估計,以實現輸電變電設備故障率預測[5]。因此本研究選擇深度前饋神經網絡建立輸電變電設備故障率預測模型。輸電變電設備故障率預測模型的建立過程如下:
(1)數據準備。首先,將經過數據預處理的數據集分為訓練集和測試集。數據集中的大部分數據將用于訓練模型,而剩余的數據將用于評估模型的性能。數據集包括多種特征作為輸入,這些特征包括設備的操作數據(如電流、電壓、溫度等)以及環境條件(如濕度、溫度、風速等)。將這些特征表示為一個輸入向量X,X的表達式如下:
其中,Xi代表不同的特征。此輸入向量將用于訓練模型。
同時,設備的故障率作為輸出標簽也包括在數據集中。故障率可以表示為一個輸出標簽Y,Y的表達式如下:
其中,Yi代表對應的設備的故障率。此輸出標簽將用于監督模型的訓練,使其學習如何根據輸入特征來預測設備的故障率。
(2)神經網絡架構設計。深度前饋神經網絡包括輸入層、隱藏層和輸出層。輸入層接受來自數據集的輸入特征,隱藏層執行非線性變換,最終輸出預測結果。本研究選擇一個包括兩個隱藏層的神經網絡。每個隱藏層的神經元數量是一個可調整的超參數,用Nhidden表示。隱藏層的數量和每個隱藏層中神經元的數量取決于任務的復雜性和數據的特性。此神經網絡的架構可表示為:
輸入層:輸入包含D個特征且每個元素都是實數的特征向量,的表達式如下:
其中,Xj表示每個特征,j是特征的索引。
第一個隱藏層:
1)神經元i的線性組合:
2)神經元i的激活函數(使用ReLU):
式中,表示第一個隱藏層中神經元i和輸入層中特征j之間的連接權重,是第一個隱藏層中神經元i的偏置。
第二個隱藏層:
1)神經元i的線性組合:
2)神經元i的激活函數(使用ReLU):
式中,表示第二個隱藏層中神經元i和第一個隱藏層中神經元j之間的連接權重;是第二個隱藏層中神經元i的偏置。
輸出層:
輸出預測值Y′:
式中,表示輸出層中神經元i和第二個隱藏層中神經元i之間的連接權重;b(3)是輸出層中神經元i的偏置。
整個神經網絡架構使用ReLU作為激活函數,通過前向傳播計算輸入特征X經過隱藏層傳遞到輸出層,從而得到故障率的預測結果Y′。隱藏層的數量和每個隱藏層中神經元的數量都是可調整的超參數,可根據具體任務和數據集進行選擇和優化。
神經網絡架構案例:如圖所示,本研究使用MATLAB創建一個包含10個特征的特征向量作為神經網絡的輸入,隨后建立兩層包含20個神經元的隱藏層,最后設置輸出層大小,模擬輸出值。

圖 神經網絡架構案例
(3)損失函數和優化器。在故障率預測問題中,本研究采用均方誤差(MSE)作為損失函數,以量化模型的性能。均方誤差計算模型的預測值與實際值之間的平方差的平均值,MSE的表達式如下:
式中,L(θ)表示損失函數;θ表示神經網絡的參數,包括權重和偏差;N表示樣本數量;Yi表示第i個樣本的實際故障率;Y′表示第i個樣本的神經網絡預測的故障率。
MSE損失函數的目標是最小化這個平方差的平均值,使模型的預測盡可能接近實際值。
為了優化神經網絡的參數(權重和偏差),本研究使用Adam優化器。Adam優化器結合了動量和自適應學習率的方法,可更有效地調整學習率,以加速訓練過程并避免陷入局部極小值。Adam優化器的更新規則如下:
式中,mt和vt分別表示梯度的一階矩估計和二階矩估計;β1和β2是衰減率,通常設置為接近1的值;?L(θt)表示損失函數關于參數θt的梯度;^mt和^vt是修正后的一階和二階矩估計;α是學習率,控制了參數更新的步長;˙o是一個極小的常數,防止除零錯誤。
通過使用MSE作為損失函數和Adam優化器,神經網絡在訓練過程中逐漸調整權重和偏差,以最小化損失函數,從而更好地擬合實際的故障率數據,有助于提高故障率預測模型的準確性和性能。
(4)模型訓練。模型訓練是深度前饋神經網絡構建的重要階段,其目標是通過使用訓練集的數據和故障率標簽來擬合模型參數,以使模型能夠準確預測故障率。在每個訓練周期中,神經網絡根據損失函數的梯度對權重和偏差進行更新,以最小化損失。此過程經常需要多次迭代,直到模型收斂到一個滿意的性能水平。訓練過程如下:
1)訓練數據集。訓練數據集由輸入特征數據Xtrain和相應的故障率標簽Ytrain組成。其中,Xtrain是一個大小為Ntrain×D的矩陣,包含Ntrain個訓練樣本,每個樣本有D個特征。Ytrain是一個大小為Ntrain×Noutput的矩陣,包含每個訓練樣本對應的故障率標簽,其中Noutput是輸出層的大小。
2)使用MSE損失函數訓練模型。使用(3)中提到的均方誤差(MSE)作為損失函數,對模型進行訓練,可表示為:
其中,θ表示神經網絡的參數 (權重和偏差),Yi,train表示第i個訓練樣本的實際故障率標簽,Y′i表示神經網絡對第i個訓練樣本的預測故障率。
3)權重和偏差更新。本研究使用(3)中提到的Adam優化器優化算法,在每個訓練周期中,根據損失函數的梯度,對權重和偏差進行更新。
4)迭代訓練。訓練過程是一個迭代的過程,每個訓練周期更新一次權重和偏差。需要多個訓練周期,直到模型在訓練數據上達到最優性能。在每個訓練周期結束后,使用驗證數據集來評估模型的性能,并根據需要進行超參數調整。
模型訓練的目標是通過不斷迭代調整神經網絡參數,使其能夠最小化損失函數,以更好地擬合故障率數據并提高預測準確性。一旦模型收斂,它將能夠對新的未知數據進行準確的故障率預測。
云平臺為模型提供了計算和存儲資源,使得實時預測和數據處理成為可能。將已訓練完成的深度前饋神經網絡故障率預測模型部署到云平臺以接收、處理和分析實時數據流,從而提供設備狀態的實時監測和故障率預測。部署過程如下。
(1)云計算資源配置。在部署之前,在云平臺中配置適當的計算資源,包括虛擬機、GPU等,以支持深度學習模型的推理和實時數據處理。
(2)模型上傳。將已訓練完成的深度前饋神經網絡故障率預測模型上傳至云平臺的模型存儲庫,以供后續的推理使用。
(3)實時數據接收。在云平臺中設置實時數據接收器,用于從設備傳感器、監測系統或其他數據源接收實時數據流。這包括設備操作數據、環境條件等輸入特征。
(4)數據處理和預測。云平臺的計算資源對實時數據進行處理,將其輸入到已部署的深度前饋神經網絡故障率預測模型中進行預測。模型會生成實時設備故障率預測作為輸出。
(5)實時監測。根據模型的輸出,云平臺實時監測設備狀態,檢測異常或高風險情況。
(6)警報生成。一旦檢測到異常或高風險情況,云平臺生成警報,通知相關維護人員或決策者采取措施。
本研究在電力系統領域取得了顯著進展,通過融合云平臺和深度前饋神經網絡,實現了輸電變電設備的故障率預測,為電力行業提供了更可靠和高效的解決方案。未來的工作將集中在進一步提高預測性能、擴展應用領域以及完善實時監測和警報系統,為智能電力系統的發展和可持續性做出貢獻。