劉鵬濤
國家管網(wǎng)集團西部管道有限責任公司, 甘肅 蘭州 730070
近年來,為減弱以煤炭為主的能源結(jié)構(gòu)體系對環(huán)境造成的破壞與污染,實現(xiàn)“雙碳”目標,以天然氣為主的清潔能源成為實現(xiàn)能源低碳轉(zhuǎn)型的最佳途徑。天然氣的主要成分是甲烷,與其他燃料相比,天然氣具有成本低、使用安全性高和環(huán)保價值較高的優(yōu)點,被廣泛應用于工業(yè)制造[1]、發(fā)電[2]以及城市生活燃氣[3]等領域。從天然氣的集中開采到使用的過程中,管道運輸是天然氣的主要運送方式,在管道中通過壓縮機組對天然氣進行加壓,以額定壓力連續(xù)平穩(wěn)地將天然氣交付給下游客戶。作為管道運輸?shù)年P鍵特種設備,壓縮機組主要由壓縮機體、潤滑系統(tǒng)、密封系統(tǒng)和輔助系統(tǒng)組成[4],為天然氣遠距離傳輸持續(xù)提供壓力保障。然而,由于天然氣的高溫、高壓和易腐蝕等特征,壓縮機組運行過程中極易發(fā)生故障,造成燃氣泄漏、全線停輸,甚至爆炸。研究表明,提前對壓縮機組的關鍵信號量監(jiān)測數(shù)據(jù)進行分析能極大降低風險和減少事故處理成本,建立可靠的模型進行預警分析已成為當前的研究熱點[5]。
目前,常用的預警分析模型主要分為三類,即基于模式識別、模糊綜合評估和深度學習。類似于機器學習,模式識別通過建立模型訓練壓縮機組的歷史監(jiān)測數(shù)據(jù)來預測當前機組的狀態(tài)。Wang Jiangyu等人[6]通過分析歷史監(jiān)測數(shù)據(jù)的相關性進行特征提取,依據(jù)分類和回歸樹建立了機組故障檢測決策樹模型(Classification and Regression Tree,CART),當數(shù)據(jù)規(guī)模較大時,該算法模型取得預警效果并不理想。Li Guannan等人[7]通過支持向量數(shù)據(jù)描述(Support Vector Data Description,SVDD)的統(tǒng)計值判斷數(shù)據(jù)樣本是否出現(xiàn)在正常區(qū)域內(nèi),作為故障檢測的依據(jù),結(jié)合主成分分析(Principal Component Analysis,PCA)提出一種PCA-R-SVDD故障預警模型。Cui Chao等人[8]將PCA和反向傳播相結(jié)合,對歷史監(jiān)測數(shù)據(jù)進行最優(yōu)變量選擇并構(gòu)建動態(tài)記憶矩陣,提出簡化的多變量狀態(tài)估計(Multivariate State Estimation Technique,MSET)預警模型。Li Xiaochuan等人[9]通過皮爾遜相關系數(shù)分析歷史正常數(shù)據(jù)和故障數(shù)據(jù)的區(qū)別,依據(jù)粒子濾波建立了增強代謝灰色故障預測模型。這些方法的共同點是通過故障數(shù)據(jù)訓練模型參數(shù)進行故障預警,但壓縮機組的故障數(shù)據(jù)樣本數(shù)量較小,故障類別偏多,依據(jù)PCA和相關系數(shù)等多元統(tǒng)計分析方法進行深層次數(shù)據(jù)特征挖掘時故障預警的準確性表現(xiàn)較差[10]。
模糊綜合評估是基于模糊數(shù)學原理,通過分析故障產(chǎn)生的各種因素建立評價指標來判別機組的運行狀態(tài)。Gan Luping等人[11]考慮故障類別的相關性,通過整合故障關鍵性分析和故障樹提出了加權(quán)模糊風險優(yōu)先級數(shù)的評估方法,一定程度上從定性和定量兩方面增強了壓縮機風險評估的準確性。為緩解指標相關性對風險評估的影響,Sun Yanji等人[12]采用最大互信息系數(shù)消除高度相關的數(shù)據(jù)指標,通過二階馬爾可夫模型獲得各個獨立數(shù)據(jù)指標的預測值和優(yōu)先級,再依據(jù)模糊隸屬度加權(quán)法評估壓縮機組的運行狀態(tài)。Ge Haiyang等人[13]結(jié)合模糊層次分析法、模糊綜合評價法以及增強故障模式效應分析,提出了基于增強故障模式效應分析的復雜系統(tǒng)風險評估模型。然而這些指標體系的建立過于主觀并且無法有效評估復雜系統(tǒng)中的多種失效模式。
隨著深度學習在圖像識別、自然語言處理以及強化學習等計算機領域取得突破性進展,吸引了工控領域的大量學者展開了對深度學習的研究。Li Xiaochuan等人[14]依據(jù)環(huán)境和氣體溫度的歷史監(jiān)測數(shù)據(jù),通過長短期記憶網(wǎng)絡(Long Short-Term Memory,LSTM)預測進氣溫度,利用規(guī)范變量分析將進氣溫度的變化作為評判壓縮機組運行性能的依據(jù),雖然該方法有效預測了進氣溫度但僅利用溫度的變化作為故障預警的依據(jù)并不可靠。Babu T N等人[15]通過傅里葉變換將軸承振動數(shù)據(jù)轉(zhuǎn)化為頻域信號,按振動信號的變化通過人工神經(jīng)網(wǎng)絡對壓縮機組運行數(shù)據(jù)進行預警分析。為增強原始數(shù)據(jù)表示強度,Zhao Dongfang等人[16]將壓縮機組振動數(shù)據(jù)轉(zhuǎn)化為二維數(shù)據(jù)重排,結(jié)合注意力機制與卷積神經(jīng)網(wǎng)絡,提出了基于信號重排的機組故障診斷模型,但這些算法模型僅適用于單一信號量監(jiān)測數(shù)據(jù)的故障預警。Qiu Jingwei[17]等人綜合考慮壓縮機組各子系統(tǒng)的監(jiān)測數(shù)據(jù),通過深度神經(jīng)網(wǎng)絡(Deep Neural Networks,DNN)學習到主要數(shù)據(jù)的特征表示,作為隱馬爾可夫(Hidden Markov Model,HMM)的顯性輸入推斷壓縮機組的故障類型,提出一種基于DNN-HNN的故障預警模型,雖然結(jié)合考慮了子系統(tǒng)數(shù)據(jù)之間的關聯(lián)性,但該方法過于依賴主特征對預警結(jié)果的影響。
現(xiàn)階段,Tian Huixin等人[18]整合振動信號、溫度、壓力等多個參數(shù)信息,采用深度置信網(wǎng)絡進行多維斷層特征提取,之后依據(jù)特征提取結(jié)果構(gòu)建健康曲線以此判斷壓縮機組運行狀態(tài),提出基于深度置信網(wǎng)絡的時空特征融合故障診斷方法(Spatio-Temporal Features Fusion Based on Deep Belief Network,STF-DBN)。馬海輝等人[19]依據(jù)傅里葉變化將壓縮機組運行數(shù)據(jù)轉(zhuǎn)化為頻域特征,作為卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)的輸入,輸出層利用Softmax函數(shù)進行故障識別,壓縮機組運行數(shù)據(jù)從時域到頻域的轉(zhuǎn)化,極大減少了人為提取特征的主觀性。雖然這些方法在一定程度上取得了較好的預測效果,但并未考慮壓縮機組系統(tǒng)中具有關聯(lián)關系信號量作用下的隱含特征對壓縮機組運行的影響。如壓縮機的出口溫度受動力渦輪轉(zhuǎn)速、上游進口壓力、進口溫度、環(huán)境溫度、潤滑系統(tǒng)、密封系統(tǒng)、空冷等多種因素影響,這些信號量監(jiān)測數(shù)據(jù)同時發(fā)生波動會使出口溫度急劇增高或降低,如果不及時預警會造成壓縮機組故障停機,影響上下游正常運輸,甚至帶來嚴重的社會和經(jīng)濟問題。此外,這些神經(jīng)網(wǎng)絡僅適用于具有一定規(guī)則的結(jié)構(gòu)數(shù)據(jù),對多信號量作用下的非歐結(jié)構(gòu)數(shù)據(jù)并不有效[20];并且壓縮機組站控報警系統(tǒng)僅在單一信號量超過設定值時才發(fā)生報警,對多因素微小故障影響下的隱含特征并不敏感。
因此,考慮多因素作用下的隱含特征對壓縮機組運行的影響,通過圖卷積神經(jīng)網(wǎng)絡(Graph Convolution Neural Networks,GCNN)對信號量的隱含特征進行特征提取,提出一種基于GCNN的壓縮機組風險預警模型。首先將時序的信號量監(jiān)測數(shù)據(jù)轉(zhuǎn)化為基于時間點的信號網(wǎng)絡,依據(jù)信號網(wǎng)絡中節(jié)點之間的關聯(lián)關系挖掘信號量的隱含特征;其次通過改進的密度峰值聚類(An Improved Density Peak Fast Search Algorithm,AIDP)算法,對信號網(wǎng)絡進行故障粗分類,獲得訓練數(shù)據(jù)標簽;最后通過GCNN學習標簽數(shù)據(jù)的隱含特征,在輸出層依據(jù)鄰接矩陣進一步強化隱含特征表示,實現(xiàn)壓縮機組風險預警分析。
密度峰值聚類(Clustering by Fast Search and Find of Density Peaks,CDP)算法是2014年發(fā)表在SCIENCE期刊上基于距離的聚類算法[21]。相比于其他類型聚類算法,CDP算法通過計算每個數(shù)據(jù)點的局部密度和最小距離能自動獲取類簇中心;并且能夠快速高效地聚類任意形狀的數(shù)據(jù)點。由于易理解、易擴展和高效性等特征,該算法近幾年來吸引了大量研究學者對其改進并應用到各個領域。
CDP算法的主要思想是通過計算任意兩個數(shù)據(jù)點之間的歐氏距離得到截斷距離dc,依據(jù)dc挖掘每個數(shù)據(jù)點的近鄰,即局部密度ρi,考慮不同類簇數(shù)據(jù)點之間的最小距離δi盡可能大,同類簇數(shù)據(jù)點之間的δi盡可能小,以ρi為橫軸,δi為縱軸構(gòu)建決策圖,依據(jù)決策圖將ρi和δi較大的數(shù)據(jù)點作為類簇中心,最后將剩余數(shù)據(jù)點依據(jù)鄰域分配到各個類中心所在的簇。
當數(shù)據(jù)點規(guī)模較大、類簇差異較小時,僅依據(jù)決策圖并不能直觀區(qū)分ρi和δi較大的數(shù)據(jù)點作為類簇中心[22];且CDP算法并不適用于無規(guī)則結(jié)構(gòu)的非歐空間數(shù)據(jù)。本文通過定義信號網(wǎng)絡的結(jié)構(gòu)相似度,依據(jù)類中心值和類中心值變化率來自動選擇聚類中心,提出了AIDP算法。
目前,熱門神經(jīng)網(wǎng)絡(如LSTM、DBN、DNN和CNN等)僅適用于具有一定規(guī)則的歐氏結(jié)構(gòu)數(shù)據(jù),如文本、圖片、音頻等。但在現(xiàn)實生活中,很多數(shù)據(jù)的結(jié)構(gòu)特征表現(xiàn)為無規(guī)則特征,不滿足平移不變性特征,如用戶之間的鏈接關系組成社交網(wǎng)絡、由知識圖譜組成的語義網(wǎng)絡等,這些神經(jīng)網(wǎng)絡并不能有效提取節(jié)點的特征表示。
GCNN由Kipf T等人[23]于2016年首次提出,依據(jù)傅里葉變換將非歐結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)化為譜域,通過拉普拉斯算子直接在譜域進行卷積操作,按特征表示類別被應用于非歐空間圖結(jié)構(gòu)數(shù)據(jù)的節(jié)點分類和圖分類任務。基于譜域的GCNN特征傳遞方式描述為:
H(l+1)=σ(?H(l)W(l))
(1)
式中:H和H為特征矩陣,分別表示l層的輸出和輸入;?=D0.5(A+I)D0.5為拉普拉斯算子,對應CNN的卷積核,A為鄰接矩陣,I為單位矩陣,D為度矩陣,滿足為l層的特征權(quán)重;σ(·)為激活函數(shù),如(Relu)。
在進行特征表示的過程中,由于GCNN很大程度上能夠保留信號量節(jié)點的隱含特征,本文通過GCNN訓練節(jié)點的鄰域獲得隱含特征表示,以提高風險預警的準確性。
為及時了解和掌握壓縮機組運行狀態(tài),保障壓縮機組安全平穩(wěn)運行,通過分析壓縮機組信號量歷史監(jiān)測數(shù)據(jù),提出了基于GCNN的壓縮機組風險預警模型,見圖1。為挖掘多個信號量微小故障作用下隱含特征對機組運行的影響,首先時序信號量監(jiān)測值轉(zhuǎn)化為基于時間點的離散信號網(wǎng)絡,之后依據(jù)AIPP算法對信號網(wǎng)絡進行故障粗分類,獲得訓練數(shù)據(jù)標簽,最后利用GCNN學習標簽樣本,充分挖掘信號量的隱含特征,實現(xiàn)風險預警。

圖1 基于GCNN的壓縮機組風險預警模型圖
由于數(shù)據(jù)采集與監(jiān)控系統(tǒng)(Supervisory Control and Data Acquisition,SCADA)是以秒為單位獲取壓縮機組的信號量監(jiān)測數(shù)據(jù),這些數(shù)據(jù)存在大量冗余,極大地增加了計算復雜度。為降低冗余,本文將SCADA信號量監(jiān)測數(shù)據(jù)離散化表示,創(chuàng)新性地給出了信號量數(shù)據(jù)集的定義描述。之后,考慮信號量之間的相關性,將信號量數(shù)據(jù)集轉(zhuǎn)化為信號網(wǎng)絡,利用邊權(quán)重和邊權(quán)重取值下限確定網(wǎng)絡的復雜程度,通過挖掘網(wǎng)絡中節(jié)點之間的潛在聯(lián)系來獲取信號量的隱含特征表示。
2.1.1 信號量數(shù)據(jù)集
在大量時序的SCADA數(shù)據(jù)中,以間隔5 s為基準取該段區(qū)間內(nèi)數(shù)據(jù)的平均值,可以獲得單個信號量精準的預測結(jié)果[24]。為了提升計算效率,通過這種描述方式,本文將時序的SCADA數(shù)據(jù)轉(zhuǎn)化為離散信號量取值;同時,考慮信號量變化趨勢的差異性和預警監(jiān)測的及時性,將1 min內(nèi)獲得的12個區(qū)間離散值作為1組信號量樣本。由此給出了信號量數(shù)據(jù)集的定義描述:給定m個SCADA信號量與n個時間點(1 min為1個時間點),信號量數(shù)據(jù)集描述為D=[S1,S2,…,Sn],其中Sn=[sn1,sn2,…,snm]表示第n個時間點內(nèi)的m個信號量數(shù)據(jù)樣本,snm=表示第m個信號量在第n個時間點內(nèi)以間隔5 s為基準的監(jiān)測平均值。
2.1.2 信號網(wǎng)絡表示
壓縮機組是由多個子系統(tǒng)組成的集成運行系統(tǒng),各子系統(tǒng)的監(jiān)測信號量之間存在復雜的關聯(lián)關系,為挖掘信號量之間潛在聯(lián)系對壓縮機組運行的影響,本文將各時間點對應的信號量數(shù)據(jù)樣本表示為信號網(wǎng)絡。
在信號網(wǎng)絡中,當信號量節(jié)點之間存在連邊時,表明信號量節(jié)點之間的監(jiān)測取值具有較強的相關性。此外,信號網(wǎng)絡的復雜程度取決于節(jié)點之間的連邊數(shù)量,連邊數(shù)量越多網(wǎng)絡結(jié)構(gòu)越復雜,復雜的網(wǎng)絡結(jié)構(gòu)可以保留更多的信號量隱含特征,但計算難度增加;反之,能夠提升計算效率,但保留的隱含特征較少。本文以信號量節(jié)點之間的相關性作為連邊依據(jù),通過邊權(quán)重得到各個節(jié)點之間相關系數(shù),之后引入F-score[18]作為邊權(quán)重取值下限,以此確定連邊數(shù)量。
(2)
(3)
綜上,給定信號量數(shù)據(jù)集D,依據(jù)上述轉(zhuǎn)化方式,與之對應的信號網(wǎng)絡最終表示為三元組集合。
現(xiàn)階段,大多算法模型進行風險預警時主要考慮如何利用信號量監(jiān)測數(shù)據(jù)構(gòu)建精確的預警模型,但劃分故障數(shù)據(jù)標簽階段的主觀因素起主要作用。為此,提出了AIDP算法對各時間點內(nèi)的信號網(wǎng)絡進行故障標簽粗劃分,類簇的數(shù)量對應標簽的種類,將故障標簽作為GCNN的訓練集,使得風險預警結(jié)果具有更高的可靠性和可解釋性,所提算法包含關鍵步驟:將各時間點內(nèi)的信號網(wǎng)絡看作為AIDP算法的數(shù)據(jù)點;依據(jù)信號量在子系統(tǒng)內(nèi)的相關性和子系統(tǒng)之間的相離性定義了信號網(wǎng)絡結(jié)構(gòu)相似度dGzGr;利用類中心值和類中心值變化率自動選擇類中心點并劃分故障類別。
2.2.1 AIDP算法描述
不同于CDP算法,AIDP算法數(shù)據(jù)點被描述為各時間點內(nèi)的信號網(wǎng)絡,并不能直接采用截斷距離dc和局部密度ρi進行故障類別劃分。為了正確識別不同時間點信號網(wǎng)絡的故障類型,本文提出了dGzGr來替代dc,并重新定義了局部密度和最小距離。
(4)
局部密度表示信號網(wǎng)絡的重要程度,最小距離表示信號網(wǎng)絡在同一類別的可能性,通常需要構(gòu)建以局部密度為縱軸,最小距離為橫軸的決策圖,通過綜合比較局部密度和最小距離取值的離散程度確定合適的聚類中心點。為實現(xiàn)對各時間點內(nèi)的信號網(wǎng)絡進行故障標簽粗劃分,依據(jù)所提信號網(wǎng)絡結(jié)構(gòu)相似度,給出了局部密度和最小距離的定義描述。
ρGz=∑χ(dGzGr-dc)
(5)
(6)
(7)
然而,在聚類中心點選擇過程中人為主觀因素起決定性作用,一些復雜的決策圖可能會造成聚類中心點的多選或少選[24],影響聚類結(jié)果的準確性。因此,本文引入類中心值ωGz與類中心值變化率rateGz來量化聚類中心點的選擇條件,提出了一個較客觀的解決思路。
ωGz=ρGz×δGz
(8)
(9)
2.2.2 AIDP算法流程
AIDP算法流程見表1。輸入信號網(wǎng)絡數(shù)據(jù)集,輸出信號網(wǎng)絡的故障類別。算法依次計算數(shù)據(jù)集中每個信號網(wǎng)絡的局部密度ρGz與最小距離δGz,獲得類中心值ωGz∈ωG,然后將整個數(shù)據(jù)集的類中心值ωG進行排序,依據(jù)類中心值變化率rateGz獲得類簇中心,最后依據(jù)近鄰距離對剩余信號網(wǎng)絡劃分類別。

表1 AIDP算法偽代碼表
本文利用AIDP算法實現(xiàn)了對各時間點的信號網(wǎng)絡粗分類,即對不同時間點內(nèi)信號網(wǎng)絡進行故障識別,將確定為故障或非故障的信號網(wǎng)絡作為GCNN的訓練數(shù)據(jù)集。本節(jié)通過GCNN神經(jīng)網(wǎng)絡訓練該數(shù)據(jù)集,學習各個信號網(wǎng)絡中關聯(lián)節(jié)點的隱含特征信息,以增強信號網(wǎng)絡的故障表示,實現(xiàn)故障早發(fā)現(xiàn),提高風險預警的準確性。
HGz=σ[?σ(?HGz(0)W(0))W(1)]
(10)
式中:H為輸出層網(wǎng)絡節(jié)點特征表示;W(0)、W(1)分別為第0層和第1層的權(quán)重矩陣。
GCNN輸出層為節(jié)點的特征表示,即信號網(wǎng)絡內(nèi)單個信號量的隱含特征,為實現(xiàn)風險預警準確性,需要對輸出層進行池化處理,以聚合信號網(wǎng)絡中每個信號量的隱含特征,得到信號網(wǎng)絡的網(wǎng)絡特征表示。目前,常用的池化處理方法包含取最大值、取平均以及求和等,這些方法由于計算效率高被研究和學者廣泛使用,但融合表示極易造成數(shù)據(jù)丟失,極大地影響預警準確性。為保留信號量節(jié)點更多的隱含特征信息,本文給出了新的節(jié)點特征池化表示方式:
oGz=AHGz·mean(HGz)
(11)
式中:o為經(jīng)池化后的網(wǎng)絡特征表示;A為節(jié)點的近鄰矩陣。
在同一個信號網(wǎng)絡內(nèi),由于近鄰節(jié)點之間滿足強相關性,將近鄰節(jié)點視為具有較強聯(lián)系的多個監(jiān)測信號量集合,依據(jù)近鄰節(jié)點之間的強相關性,能夠增強網(wǎng)絡故障特征表示,提升多個監(jiān)控信號量微小故障對壓縮機組運行的影響。
sGz=(s1,s2,…,sk)T=softmax(oGz·w+b)
(12)
同理,對于剩余網(wǎng)絡,通過交叉熵損失函數(shù)不斷重復上述過程,直到預測故障類別與真實標簽之間的差異盡可能小,整個訓練結(jié)束。
(13)
式中:stGz=表示信號網(wǎng)絡Gz的真實故障分類,采用one-hot編碼。當時,對于第k類,輸出概率s越接近1時,模型越準確;當時,對于第k類,輸出概率s越接近0時,模型越準確。
選擇某壓氣站場3臺離心壓縮機組運行數(shù)據(jù)作為實驗數(shù)據(jù)集來驗證算法模型的可行性,自投產(chǎn)以來,該壓氣站場的單臺壓縮機最大連續(xù)運行時間超過7 000 h。為便于分析和理解,通過所提出的模型對該壓氣站場典型的出口溫度過高的異常事件進行風險預警,該事件主要原因是動力渦輪轉(zhuǎn)速、上游進口溫度和進口壓力過高,次要原因包含潤滑系統(tǒng)、密封系統(tǒng)、外界環(huán)境溫度過高等。為提高風險預警的精確度,本文將異常事件發(fā)生前2 h和發(fā)生后5 min內(nèi)的運行數(shù)據(jù)作為分析依據(jù),得到包含128個SCADA監(jiān)測信號量和125個時間點的實驗數(shù)據(jù)集D128×125×12。
125個時間點對應的壓縮機組出口溫度、壓縮機組動力渦輪轉(zhuǎn)速、壓縮機組進口壓力、環(huán)境溫度見圖2。由圖2-a)可看出,在121~125個時間點內(nèi),壓縮機組出口溫度較高,為異常事件發(fā)生之后的溫度狀態(tài)。由圖2-b)、c)和d)可看出,第100個時間點之前的數(shù)據(jù)值都趨于平穩(wěn),當超過第100個時間點之后,動力渦輪轉(zhuǎn)速、壓縮機組出口壓力、環(huán)境溫度都有明顯的變化。當時異常發(fā)生在夏季,環(huán)境溫度處于上升狀態(tài),各影響因素使壓縮機組進口壓力處于下降趨勢,加之動力渦輪轉(zhuǎn)速提高,是造成此次壓縮機組出口溫度過高異常事件的主要原因。

a)出口溫度
依據(jù)所提信號量監(jiān)測值的網(wǎng)絡表示模型,獲得了該數(shù)據(jù)集對應的信號網(wǎng)絡表示,給出了AIDP算法對該數(shù)據(jù)集的聚類中心決策圖,見圖3。圖3中每個數(shù)據(jù)點對應1個信號網(wǎng)絡,數(shù)據(jù)點編號分別對應異常事件發(fā)生前、后的時間點,如第125個時間點表示事件發(fā)生后第5 min內(nèi)的信號網(wǎng)絡。由圖3看出該數(shù)據(jù)集的類中心分別為85、121,數(shù)據(jù)點110具有較高的局部密度和最小距離,從決策圖中并不能直觀確定為聚類中心。因此,本文通過AIDP算法依據(jù)類中心值變化率確定85、121、110為聚類中心,分別對應正常運行信號網(wǎng)絡、異常信號網(wǎng)絡和類別不確定的信號網(wǎng)絡,經(jīng)過故障識別粗分類之后,獲得了3種類別的信號網(wǎng)絡數(shù)據(jù)集Dataset。

圖3 AIDP算法聚類決策圖
數(shù)據(jù)集Dataset包含101個正常運行信號網(wǎng)絡、5個異常信號網(wǎng)絡和19個類別不確定的信號網(wǎng)絡,見表2。

表2 Dataset數(shù)據(jù)集表
其中5個異常類為第121、122、123、124和125個時間點,都處于異常事件發(fā)生后的時間點內(nèi);正常運行類包含的信號網(wǎng)絡,都處于事件發(fā)生前的時間點內(nèi),進一步表明AIDP算法對于故障識別具有極高的準確性。而對于最后一類,由于包含的信號網(wǎng)絡所在時間點已非常接近異常事件發(fā)生時間點,此時動力渦輪轉(zhuǎn)速、上游環(huán)境溫度、進口壓力和其他因素的信號量監(jiān)測值不斷發(fā)生波動變化,由于AIDP算法的信號網(wǎng)絡結(jié)構(gòu)相似度是依據(jù)信號量在子系統(tǒng)內(nèi)的相關性和子系統(tǒng)之間的相離性來定義的,并不能有效識別多個監(jiān)測信號量監(jiān)測值波動引起的異常事件。之后將該數(shù)據(jù)集的正常運行信號網(wǎng)絡和異常信號網(wǎng)絡用于訓練基于GCNN的壓縮機組風險預警模型,通過模型對類別不確定的信號網(wǎng)絡進行風險識別。
將106個帶標簽的信號網(wǎng)絡采用五折交叉驗證劃分為80%訓練集和20%測試集兩部分,來驗證模型的準確性。訓練集包含了82個正常運行信號網(wǎng)絡和3個異常信號網(wǎng)絡,驗證集分別包含19個正常運行和異常信號網(wǎng)絡,當訓練集模型收斂時,驗證結(jié)果中得到的正常運行與異常信號網(wǎng)絡分別是19個、2個,正確率達到了100%,見表3。實驗結(jié)果表明,本文模型對信號網(wǎng)絡的異常識別具有非常高的準確性和魯棒性,此外,采用交叉驗證的方法能夠更加有效地驗證模型的性能,提高模型的可靠性。

表3 測試分類結(jié)果表
為驗證模型的風險預警能力,通過訓練106個帶標簽的信號網(wǎng)絡,當訓練模型收斂時,對125個信號網(wǎng)絡進行結(jié)果驗證,獲得了125個信號網(wǎng)絡的softmax所屬類的概率值,風險預警結(jié)果見圖4。從圖4可看出,在0~114時間點內(nèi)的信號網(wǎng)絡屬于正常運行類,從第115個時間點開始,對應的信號網(wǎng)絡劃分為異常類,比發(fā)生壓縮機組出口溫度過高的異常事件的發(fā)生提前了6 min,進一步驗證了所提出的模型對風險預警的及時性和預警性。由于GCNN保留了信號量節(jié)點之間的隱含特征信息,通過訓練節(jié)點表示,隱含特征信息將各微小的異常信號量逐漸放大,有效避免了平局池化后節(jié)點特征消失問題;所提出的模型在網(wǎng)絡表示過程中,將近鄰關系與節(jié)點表示再一次融合,進一步提升了多個相關聯(lián)信號量節(jié)點的隱含特征對風險預警的影響,也規(guī)避了AIDP算法無法精確區(qū)分微小故障的問題。
信號網(wǎng)絡中,網(wǎng)絡的復雜程度取決于節(jié)點之間的連邊數(shù)量,連邊數(shù)量越多網(wǎng)絡結(jié)構(gòu)越復雜,故障識別的準確度越高,但極大地增加了計算量;反之,網(wǎng)絡包含的信息也就越少,對故障識別的難度隨之增大。本文采用θvivj作為信號網(wǎng)絡的邊權(quán)重,節(jié)點之間關聯(lián)程度隨θvivj值減小而減小,確定合適的θvivj取值能夠減少數(shù)據(jù)和冗余數(shù)據(jù)對實驗結(jié)果帶來的影響,提升故障分類的精準率。

圖5 邊權(quán)重取值下限分析圖
壓縮機組并不是一個獨立的運行系統(tǒng),而是由壓縮機體、潤滑系統(tǒng)、密封系統(tǒng)和輔助系統(tǒng)等多個子系統(tǒng)組成的復雜集成運行系統(tǒng),各個子系統(tǒng)之間相互配合共同保障壓縮機組的安全平穩(wěn)運行。各子系統(tǒng)監(jiān)測信號量之間存在復雜的關聯(lián)關系,針對多監(jiān)測信號量作用下隱含特征對壓縮機組運行的影響,提出了基于GCNN的壓縮機組風險預警模型。與以往風險預警方法不同,為了提取信號量監(jiān)測數(shù)據(jù)的隱含特征,該模型將監(jiān)測數(shù)據(jù)轉(zhuǎn)化為基于時間點的信號網(wǎng)絡,按AIDP算法對信號網(wǎng)絡進行故障粗分類得到訓練標簽樣本,通過GCNN訓練標簽數(shù)據(jù)的隱含特征實現(xiàn)壓縮機組風險預報警。
對壓縮機組出口溫度過高異常事件進行實驗預警分析,所提模型的故障標簽識別率達到了100%;與事件發(fā)生時間相比,所提模型預測發(fā)生時間提早了6 min,極大增強了風險識別的準確性與風險預警能力,為事件的安全處理提供了充足的準備時間。在未來工作中,將重點關注所提模型對風險預警及時性和可靠性的研究,為壓縮機組的可靠穩(wěn)定運行提供安全保障。