閆會(huì)玉,鄭澤宇,宋 宏,高 原
(1.中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所,遼寧 沈陽(yáng) 110016;2.中國(guó)科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院,遼寧 沈陽(yáng) 110016;3.中國(guó)科學(xué)院大學(xué),北京100049)
隨著工業(yè)自動(dòng)化、智能化進(jìn)程的不斷發(fā)展,變頻器被廣泛應(yīng)用于鋼鐵、化工、石油、冶金、水處理等各行業(yè)中,已成為當(dāng)今節(jié)電、提高生產(chǎn)過(guò)程自動(dòng)化水平、改造傳統(tǒng)工業(yè)、推動(dòng)技術(shù)進(jìn)步的主要手段之一[1]。然而,在復(fù)雜的自然環(huán)境(結(jié)露、腐蝕、粉塵、高低溫等)和電磁環(huán)境(EMI、過(guò)電壓、過(guò)電流等)下,變頻器極易發(fā)生故障,嚴(yán)重危害操作人員安全[2-3]。異常檢測(cè)是故障診斷的第一步,在整個(gè)故障診斷過(guò)程中是最為關(guān)鍵的一步,因此變頻器異常檢測(cè)研究具有重要的意義。目前,異常檢測(cè)在變頻器方面的研究還不夠成熟。主要的檢測(cè)方法有基于分析模型的方法,基于定性經(jīng)驗(yàn)知識(shí)的方法和基于數(shù)據(jù)驅(qū)動(dòng)的方法。參數(shù)估計(jì)、狀態(tài)估計(jì)、分析冗余法都是常用的分析模型[4-5]方法,但隨著系統(tǒng)復(fù)雜度的不斷提升,該方法難以獲取足夠多的系統(tǒng)復(fù)雜原理的每一個(gè)細(xì)節(jié),無(wú)法建立精確的數(shù)學(xué)模型,雖然這種不精確性能夠使模型的魯棒性變好,但同時(shí)也容忍了故障的發(fā)生。基于定性經(jīng)驗(yàn)知識(shí)的方法,主要有專家系統(tǒng)[6]、符號(hào)有向圖等,該方法需要領(lǐng)域?qū)<姨峁┥詈竦膶I(yè)知識(shí)和長(zhǎng)期積累的經(jīng)驗(yàn)知識(shí),現(xiàn)實(shí)操作性較難。數(shù)據(jù)驅(qū)動(dòng)的方法是結(jié)合先進(jìn)的人工智能技術(shù)、信號(hào)處理技術(shù)以及一些數(shù)理統(tǒng)計(jì)方法,通過(guò)監(jiān)測(cè)設(shè)備運(yùn)行,提取設(shè)備運(yùn)行異常特征,根據(jù)特征變化識(shí)別異常。常用的數(shù)據(jù)驅(qū)動(dòng)方法,如模糊控制[7-8]、小波變換[9-10]、神經(jīng)網(wǎng)絡(luò)[11]等,這些方法的診斷需要大量的正常、異常運(yùn)行數(shù)據(jù)來(lái)訓(xùn)練模型。而在現(xiàn)實(shí)生產(chǎn)中的變頻器數(shù)據(jù)量很大,但大部分都是正常數(shù)據(jù),異常樣本非常少,降低了以上方法的現(xiàn)實(shí)可行性。
針對(duì)以上問(wèn)題,提出一種基于密度峰值聚類與概率統(tǒng)計(jì)分析的方法,該方法屬于數(shù)據(jù)驅(qū)動(dòng)的方法,但該方法不需要大量的異常數(shù)據(jù)樣本,適用于長(zhǎng)期處于在同一種工作條件下的設(shè)備進(jìn)行異常檢測(cè)。該方法通過(guò)對(duì)特定條件下的設(shè)備正常運(yùn)行數(shù)據(jù)進(jìn)行分析,構(gòu)建該條件下的正常運(yùn)行模式,利用該模式來(lái)識(shí)別異常行為。首先對(duì)設(shè)備海量歷史運(yùn)行數(shù)據(jù)進(jìn)行密度峰值聚類,然后計(jì)算不同類簇之間的轉(zhuǎn)移概率,基于歷史類簇及其相互間的轉(zhuǎn)移概率并結(jié)合滑動(dòng)時(shí)間窗口模型提出異常檢測(cè)框架,對(duì)新的設(shè)備運(yùn)行數(shù)據(jù)運(yùn)行情況進(jìn)行異常判別,最后通過(guò)變頻器異常數(shù)據(jù)案例驗(yàn)證了該方法用于異常檢測(cè)的有效性。該方法通過(guò)密度峰值聚類能夠簡(jiǎn)化多維參量的復(fù)雜關(guān)系;同時(shí)通過(guò)聚類識(shí)別異常來(lái)代替閾值限定識(shí)別異常,可以解決傳統(tǒng)閾值限定方法中閾值設(shè)定無(wú)參考的問(wèn)題;最后通過(guò)分析類簇轉(zhuǎn)移規(guī)律,用概率表示不同類簇間的轉(zhuǎn)移特點(diǎn),能夠從時(shí)間維度上發(fā)現(xiàn)設(shè)備運(yùn)行的異常狀況。

表示當(dāng)點(diǎn)i為局部密度最大點(diǎn)時(shí),求與i距離最遠(yuǎn)點(diǎn)的距離。否則,求比i點(diǎn)密度大的點(diǎn)距i點(diǎn)的距離的最小值。
步驟2 確定聚類中心
(1)根據(jù)決策圖,設(shè)置密度閾值ρth和距離閾值δth。(2)當(dāng)xi的最小距離δi>ρth,且ρi>ρth時(shí),xi為聚類中心,并賦予類別標(biāo)簽。(3)按照(2)遍歷所有數(shù)據(jù)點(diǎn),找到所有的聚類中心。
步驟3 為非聚類中心點(diǎn)歸類
將非聚類中心點(diǎn)的比其局部密度大的鄰居點(diǎn)的類別標(biāo)簽,作為該點(diǎn)的類別標(biāo)簽。若其所有高密度鄰居同為無(wú)類別屬性,繼續(xù)迭代,直至找到為聚類中心的高密度鄰居點(diǎn)。
2.1.2 密度峰值聚類方法優(yōu)化
從前文可知,在密度峰值聚類算法中,超參數(shù)截?cái)嗑嚯xdc,對(duì)聚類結(jié)果有較大的影響。截?cái)嗑嚯xdc過(guò)大,導(dǎo)致數(shù)據(jù)點(diǎn)的局部密度值差別太小,降低聚類的差異性;若dc過(guò)小,又會(huì)使簇類結(jié)果變多,降低聚類的內(nèi)聚性。因此,找到一個(gè)合適的截?cái)嗑嚯x,對(duì)密度峰值聚類方法非常重要。參考文獻(xiàn)[13]中的方法,該方法引入了K近鄰的思想,提出確定dc的新方案。

通過(guò)密度峰值聚類,得到類簇時(shí)序數(shù)據(jù)S={S1,S2,…,St,…,Sn},其中St表示t時(shí)刻運(yùn)行數(shù)據(jù)所屬類簇編號(hào),S∈{1,2,…,M}。設(shè)備的整個(gè)運(yùn)行過(guò)程就是在不同類簇之間進(jìn)行轉(zhuǎn)移的過(guò)程,通過(guò)分析類簇時(shí)序的轉(zhuǎn)移概率Pij能夠找到設(shè)備正常運(yùn)行時(shí)的變化規(guī)律。Pij表示從類簇i向類簇j轉(zhuǎn)移的概率。

假設(shè)聚類結(jié)果共M簇,那么類簇轉(zhuǎn)移概率分布,如表1 所示。

表1 類簇轉(zhuǎn)移概率分布表Tab.1 Cluster Transfer Probability Distribution Table
根據(jù)類簇轉(zhuǎn)移概率分布,得到概率轉(zhuǎn)移時(shí)序P={PS1S2,PS2S3,…,PSn-1Sn}
由于概率值是在正常運(yùn)行模式下計(jì)算得到,那么概率值越大說(shuō)明這兩種類簇之間的轉(zhuǎn)移更頻繁,那么這種轉(zhuǎn)移情況便更符合正常運(yùn)行模式。但是設(shè)備的運(yùn)行隨時(shí)隨地都會(huì)有噪聲的存在,正常數(shù)據(jù)向噪聲數(shù)據(jù)轉(zhuǎn)移的概率較低,影響異常判別。通過(guò)滑動(dòng)時(shí)間窗口取平均的方法利用正常數(shù)據(jù)轉(zhuǎn)移的大概率,來(lái)補(bǔ)償噪聲數(shù)據(jù)出現(xiàn)時(shí)的小概率問(wèn)題,能夠提高判別的準(zhǔn)確率。同時(shí)實(shí)時(shí)異常檢測(cè)作業(yè),本質(zhì)上屬于短小批處理作業(yè)過(guò)程,利用滑動(dòng)時(shí)間窗口模型,能夠快速找到非正常的運(yùn)行模式,實(shí)時(shí)處理監(jiān)測(cè)數(shù)據(jù)。


圖1 時(shí)間滑動(dòng)窗口模型Fig.1 Time Sliding Window Model
異常檢測(cè)整體框架圖,如圖2 所示。首先利用大量的正常運(yùn)行時(shí)的歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行密度峰值聚類,并計(jì)算滑動(dòng)窗口下的平均轉(zhuǎn)移概率;然后對(duì)新的監(jiān)測(cè)數(shù)據(jù)進(jìn)行類簇匹配,并計(jì)算新數(shù)據(jù)的平均轉(zhuǎn)移概率;當(dāng)數(shù)據(jù)頻繁出現(xiàn)與現(xiàn)有類簇均不匹配或者平均轉(zhuǎn)移概率值低于正常概率值時(shí),判定設(shè)備出現(xiàn)異常;根據(jù)出現(xiàn)類簇不匹配的時(shí)間和概率值開(kāi)始下降的時(shí)間,判斷設(shè)備異常發(fā)生的時(shí)間。

圖2 異常檢測(cè)框架圖Fig.2 Framework for Abnormal Detection
利用某油田變頻器的運(yùn)行數(shù)據(jù)來(lái)驗(yàn)證文章中提出的方法,該油田變頻器長(zhǎng)期工作在一種不變工況下,數(shù)據(jù)采樣周期為1s,數(shù)據(jù)標(biāo)簽有時(shí)間、母線電壓、輸出電壓、輸出電流、輸出轉(zhuǎn)矩、運(yùn)行頻率。模型訓(xùn)練環(huán)境:python3.6,win10 操作系統(tǒng)。利用120 天的正常運(yùn)行數(shù)據(jù)訓(xùn)練正常運(yùn)行模式。油田變頻器前5 條數(shù)據(jù),如表2 所示。

表2 變頻器運(yùn)行數(shù)據(jù)Tab.2 Inverter Operation Data

表3 類簇轉(zhuǎn)移概率分布矩陣Tab.3 Cluster Transfer Probability Distribution Matrix
在密度峰值聚類中,K值取15,計(jì)算得到dc=0.27。通過(guò)密度峰值聚類,最后得到10 個(gè)正常類簇,并將離群點(diǎn)作為異常類簇0,類簇間的轉(zhuǎn)移概率分布,如表3 所示。取滑動(dòng)時(shí)間窗口大小W=30,經(jīng)過(guò)滑動(dòng)窗口模型處理后的狀態(tài)轉(zhuǎn)移序列,如圖3 所示。

圖3 正常模式下平均轉(zhuǎn)移概率Fig.3 Average Transfer Probability in Normal Mode
從圖3 中可以看出,正常運(yùn)行情況下,滑動(dòng)窗口下的平均轉(zhuǎn)移概率集中在(0.45~0.55)之間,該變頻器在該工況下的正常運(yùn)行模式需要符合(0.45~0.55)之間的概率變化,反之,若小于該概率,說(shuō)明設(shè)備運(yùn)行有異與以往的運(yùn)行規(guī)律,可能是異常的出現(xiàn)所導(dǎo)致。
案例1:電磁環(huán)境干擾,變頻器內(nèi)部工作機(jī)制紊亂。
從第153 點(diǎn)開(kāi)始變頻器運(yùn)行紊亂,如圖4(a),圖4(b)所示。輸出電壓、輸出電流有別于正常運(yùn)行情況下的波動(dòng)規(guī)律,但并未超出閾值限值,單純依靠?jī)?nèi)部閾值檢測(cè)電路并不能發(fā)現(xiàn)異常。通過(guò)分析其各個(gè)狀態(tài)轉(zhuǎn)移概率的變化,如圖4(d)所示。發(fā)現(xiàn)從第153 個(gè)數(shù)據(jù)點(diǎn)開(kāi)始滑動(dòng)窗口下的平均轉(zhuǎn)移概率迅速下滑,概率值低于正常模式水平,判斷是一種異常現(xiàn)象。


圖4 故障1 數(shù)據(jù)及分析圖Fig.4 Fault-1 Data and Analysis Chart
案例2:制動(dòng)單元故障。

圖5 故障2 數(shù)據(jù)及分析圖Fig.5 Fault-2 Data and Analysis Chart
油田變頻器在下行過(guò)程中,電機(jī)在高速運(yùn)轉(zhuǎn)時(shí)突然制動(dòng),但電動(dòng)機(jī)的轉(zhuǎn)子帶著負(fù)載有較大的機(jī)械慣性,不可能很快的停止,這樣就產(chǎn)生反電勢(shì),電動(dòng)機(jī)處于發(fā)電狀態(tài),其產(chǎn)生反向電壓轉(zhuǎn)矩與原電動(dòng)狀態(tài)轉(zhuǎn)矩相反,而使電動(dòng)機(jī)具有較強(qiáng)的制動(dòng)力矩,迫使轉(zhuǎn)子較快停下來(lái)。但由于通常變頻器中的整流電路是不可逆的,因此無(wú)法回饋到電網(wǎng)上去,能量將在濾波電容上累積,產(chǎn)生泵升電壓,它對(duì)變頻器有極大的破壞力。但在工作過(guò)程中這種現(xiàn)象無(wú)法避免,因此通常會(huì)在直流母線之間接通一個(gè)能耗電阻,當(dāng)母線電壓超過(guò)一定值時(shí),通過(guò)電阻將多余的能量吸收。圖5(b)從第100 個(gè)點(diǎn)開(kāi)始,變頻器輸出電流出現(xiàn)過(guò)高數(shù)據(jù)點(diǎn),圖5(a)從126個(gè)數(shù)據(jù)點(diǎn)開(kāi)始輸出電壓有明顯的沖高現(xiàn)象,同時(shí)變頻器報(bào)過(guò)壓警告,如圖5 所示。根據(jù)前文提出的異常檢測(cè)方法,如圖5(d)所示。雖然經(jīng)滑動(dòng)平均后的轉(zhuǎn)移概率并沒(méi)有明顯的低概率出現(xiàn),但在圖5(c)聚類結(jié)果中,從113 個(gè)數(shù)據(jù)點(diǎn)開(kāi)始頻繁出現(xiàn)一些不屬于任何現(xiàn)有類簇的數(shù)據(jù)點(diǎn),所以該方法仍能夠提前識(shí)別出異常。
變頻器設(shè)備原理復(fù)雜,監(jiān)測(cè)數(shù)據(jù)量大,基于模型與基于經(jīng)驗(yàn)的方法實(shí)現(xiàn)困難,而普通的神經(jīng)網(wǎng)絡(luò)、模糊控制等方法又因?yàn)楫惓颖静蛔銌?wèn)題仍無(wú)法實(shí)現(xiàn)。針對(duì)以上問(wèn)題,提出一種基于密度峰值聚類和概率統(tǒng)計(jì)分析的異常檢測(cè)方法,充分了利用變頻器監(jiān)測(cè)數(shù)據(jù)量大的特點(diǎn),找到了一種工況不變情況下的設(shè)備正常運(yùn)行模式,并通過(guò)對(duì)比正常模式,識(shí)別出了設(shè)備異常行為。但該方法只適用于同一設(shè)備在固定工況下工作時(shí)的異常識(shí)別,不能識(shí)別在多變工況下工作的設(shè)備異常行為,下一步將在這方面進(jìn)行深入的研究。