劉肅平,譚志平
廣東科技學院 計算機系,廣東 東莞 523083
機組由主機和輔機設備組成,目前在機組的運行過程中,由于重大設備故障而導致機組計劃外停機已經達到平均兩年一次的頻率[1]。輔機設備作為機組的重要組成部分,往往是機組狀態檢測的薄弱環節。因此,輔機設備能否安全運行的關鍵問題在于是否能做好輔機設備的狀態監測工作。做好輔機設備狀態監測能保證電廠機組正常運行,減少電廠因停機而帶來的經濟損失,而且也能通過對輔機設備的狀態監測保證工作人員的人身安全。因此,加強對輔機設備的狀態監測成為電廠迫切需要解決的問題。
輔機設備在運行過程中,噪音和振動現象十分普遍,隨著設備運行時間的延長,噪音振動呈全面加劇之勢。國網、南方和香港電網近一兩年發生的幾起機組輔機設備故障,其故障原因尚未確準,但運行人員反映其最明顯的特征是運行中噪音振動明顯變大。目前既無此方面的數據記錄和積累,也無具體可執行的技術措施、標準或手段進行定量化的評測和管理,故有必要展開對輔機設備振動、噪音等特征量的研究。
目前,國內外在該領域做了一些有益的嘗試。文獻[2-3]中,開發了輔機設備預警系統,但具有很大的技術局限性。系統只能監測少量輔機設備,隨著對輔機設備狀態監測的廣度和深度的不斷加強,數據成指數級增長,該系統將無法實時處理數據流,更不能對海量數據進行數據挖掘和建模,對海量數據的集成管理、實時處理、分析、展現成為技術難題。隨著大數據技術的不斷發展,實時大數據分析技術在商業互聯網領域應用廣泛,但是大數據在狀態監測領域的應用研究還處于探索起步階段,只有一些理論研究。文獻[4]提出了大數據要求下在線監測系統建設要點,包括數據采集、傳輸、存儲、調用、挖掘分析;文獻[5]提出了復雜裝備的狀態監測實時流數據處理框架;文獻[6]探討了在輸變電設備狀態監測領域的實時流數據處理框架,全面提高了數據處理的實時性;文獻[7]提出了如何有效存儲和分析輸變電狀態監測大數據的研究方法。分析可知,雖然未形成真正能應用于輔機設備狀態監測領域的實時大數據分析技術,但提供了一些技術參考。
本文在此基礎上,探討了在輔機設備狀態監測分析與研究領域的實時大數據處理技術,解決了在這一應用領域的大數據技術難題,研發了一個輔機設備噪音振動大數據研究平臺,滿足了對輔機設備大范圍狀態監測與研究的需求,為大數據技術在輔機設備領域的應用進行有益的嘗試。
本文監測的對象為某電廠#5、#6兩個機組的41臺輔機設備。采集#5、#6發電機組的12臺風機、10臺磨煤機、10臺水泵、6臺氣泵噪音振動數據以及2臺升壓變、1臺啟備變的噪音振動、中性點電流、高壓側電流、電壓、諧波數據,共計208個數據采集點。按1 s間隔,以48 kHz/24 bit采集噪音數據,以25.6 kHz/16 bit采集振動、電流、電壓數據,每分鐘數據總量為982.88 MB,每天數據總量為1 382.17 GB,每月數據總量為40.49 TB。如此大規模的流數據要求在線實時處理,及時評估設備狀態,這對在線監測系統的實時性、吞吐量和可靠性等方面提出了很高的要求。
通常實時大數據計算模式分為兩類:流式計算(Stream Computing)和批量計算(Batch Computing)。它們分別適用于不同的應用場景:對于先存儲后計算,實時性要求不高,同時數據的準確性、全面性更為重要的應用場景,批量計算模式更加適合;對于無需先存儲,可以直接進行數據計算,實時性要求很嚴格,但數據的精確度要求稍微放寬的應用場景,流式計算具有明顯優勢[8]。大數據計算模式如圖1所示。

圖1 大數據計算模式
結合本文的需求來看,一方面需要實時處理采集到的噪音、振動、電流、電壓、諧波原始數據,計算得到噪音的A、C、Z值和振動速度v、加速度g、位移s值以及全頻譜數據,實現對輔機設備運行狀態的實時監測;另一方面,將所有原始數據集中存儲至大數據服務器中,建立輔機設備的噪音振動大數據庫,可對歷史數據進行全面的分析,包括FFT全頻譜分析、趨勢分析等,且能作為對輔機設備故障診斷、故障定位等深層次研究的一個平臺。因此,本文采用流式數據實時分析技術和實時批處理技術相結合的方式,對應目前的主流開源框架技術,采用Storm+Hadoop架構,如圖2所示。

圖2 狀態監測數據實時處理體系結構
監測數據以數據流的方式進入系統,首先利用Storm以流計算的方式,對流式監測數據進行快速計算和處理,形成針對特定運齡、工況、環境條件下輔機設備運行特征參數的判斷、預測和預警處理,處理后的數據傳輸至實時監測中心,通過大數據的數據展現技術,管理人員可直觀、準確地看到各個輔機設備的運行狀態;然后,采用批計算技術,將海量原始數據存儲到基于Hadoop的分布式文件系統(Hadoop Distributed File System,HDFS)中,建立大數據庫,再采用基于MapReduce的大數據分析技術對海量數據進行數據挖掘和建模,從而發現隱藏在海量數據中豐富、有價值的信息,為輔機設備的更深層次的研究建立一個研究平臺。
目前,大數據流式計算系統實例有很多,其中比較典型的、應用比較廣泛的、具有代表性的是Storm系統[9]、S4系統、Puma系統、Kafka系統、TimeStream系統,各有優勢。其中,Storm是一款分布式、開源的、實時的、主從式大數據流式系統,在電力行業狀態監測領域應用較多。
Storm采用主從系統架構,在輔機設備狀態監測中,使用Storm處理流數據時,首先要設計流數據處理過程中的任務拓撲(Topology)結構,即Storm的邏輯單元,對狀態監測流數據的處理順序依次為獲取數據、去噪(多種)、計算特征量、狀態評價等。任務拓撲結構如圖3所示。

圖3 Topology結構
一個任務拓撲是由一系列Spout和Bolt構成的有向無環圖,通過數據流(Stream)實現Spout和Bolt之間的關聯。在圖3中,Spout負責從外部數據源不斷地讀取數據,并以Tuple元組的形式發送給相應的Bolt;Bolt負責對接收到的數據流進行計算,表示數據處理的一個過程,比如去噪、計算特征量、評價等;不同的特征量計算方式和不同的評價方式表示不同的Bolt,一個Bolt的輸出,可以作為另一個Bolt的輸入。在對各個特征量的評價中,不同的設備、不同的運行時間段,標準值會有所不同。將計算后的特征量與標準值相比較,評估出各個設備在相應時間段的運行狀態,若超出閾值,立刻預警。
在狀態監測中,除了對流式監測數據進行快速處理,對設備狀態進行分析外,隨著輔機設備運行時間的累積,形成了海量的歷史數據,有必要對海量歷史數據進行存儲,并通過對歷史數據的數據挖掘,找到隱藏在大數據中的有價值的信息。
Hadoop分布式文件系統采用主從架構,Hadoop集群可采用廉價PC。MapReduce是一種處理海量數據的并行編程模型和計算框架,用于對大規模數據集的并行查詢和計算,該計算模式在Hadoop上得到了實現。通過這兩項技術的結合,可搭建分布式、高性能、可伸縮的數據存儲系統,實現對狀態監測動態信息的存儲和并行查詢,構建低成本、高效率的輔機設備大數據挖掘與分析研究平臺[10-12]。
系統采用分布型網絡體系架構,由2臺大數據服務器、100 Mb/s光纖以太網和按輔機設備配置的41臺S930智能噪音振動傳感器三部分構成。1臺S930監測1臺輔機設備。S930負責采集流數據并進行流式計算,形成針對特定運齡、工況、環境條件下輔機設備運行特征參數的判斷和預警處理;大數據服務器主要負責將輔機設備的狀態監測數據存儲到HDFS中,建立大數據庫,以及利用MapReduce并行編程模型和計算框架,對大規模數據集進行并行查詢和計算。此外,大數據服務器中的高級應用軟件可利用大數據庫中的數據進行分析和研究。系統結構如圖4所示。

圖4 系統結構圖
在圖4中,S930按照實時1 s間隔,以48 kHz/24 bit采集噪音數據,以25.6 kHz/16 bit采集振動、電流、電壓數據。然后,S930利用Storm以流計算的方式,對流式監測數據進行快速計算和處理,得到噪音A、C、Z值和振動速度v、加速度g、位移s值,按頻點計算實時頻譜值,再與標準值相比較,作出評價。通過以太網,將處理后的數據傳輸至監測中心并實時顯示,實現了對該位置的輔機設備的狀態監測以及預警;同時,S930將狀態監測流數據壓縮,通過IEC61850/ModBus/DNP通信協議傳輸至大數據服務器的HDFS中進行存儲,建立輔機設備振動噪音大數據庫;當監測人員發現某個輔機設備出現預警信息時,監測人員可通過Web網頁登錄大數據服務器中的高級應用軟件FFT分析儀,分析儀通過MapReduce查詢到待分析數據在HDFS中的具體位置,并讀取。分析儀利用讀取的原始數據進行FFT全頻譜分析、趨勢分析,并在界面中顯示分析結果。
4.2.1 S930
硬件選型如下:
(1)噪音傳感器,采用AWA14423的電容傳聲器,1級聲級精度標準,靈敏度50 mV/Pa,頻帶范圍10 Hz~20 kHz,動態范圍15~140 dB。
(2)振動傳感器,采用YD9200的振動速度傳感器,靈敏度20 V/(m?s),頻帶范圍10~1 000 Hz。
(3)前置放大器,采用型號為AWA14604的前置放大器,1級聲級精度標準,與聲音傳感器和振動傳感器相連,頻帶范圍10 Hz~100 kHz,動態范圍15~134 dB。
(4)模擬數字轉換器(ADC),采用AD7606,這是一款16位,8通道同步采樣模數數據采樣系統(DAS),工作電壓是5 V,提供SPI接口,方便與MCU之間進行參數的傳遞。
(5)CPU,采用恩智浦公司推出的LPC1788芯片,以Cortex-M3為內核的微控制器,主頻高達120 MHz,具有8通道的DMA控制器,片上有EEPROM,其掉電保存,方便保存一些固定參數,支持SDRAM外設,SDRAM的大容量有利于保存大量的采樣數據,同時還具有豐富的接口功能。
以上硬件組裝非常方便,整機完全滿足測量范圍30~130 dB和實時監測的要求。
硬件設計結構如圖5所示。

圖5 S930硬件設計框圖
4.2.2 大數據服務器
硬件選型如下:
(1)服務器,采用型號為ThinkServerTD340 S2407v2 4/1 THO的服務器,主頻為2 400 MHz,硬盤擴展至16TB,支持多個千兆網口,操作系統是Windows Server 2012 R2版本,數據庫管理系統采用SQL Server2012版本。
(2)液晶顯示屏,采用聯想的LI2032WD十九寸液晶屏,實時顯示每個設備的預警信息。
(3)快速以太網收發器,采用型號為STV-D8110-MC-2KM,與光纜相連,接收光纜傳遞的信號。
(4)光電轉換器,采用型號為T651的智能終端,將電纜輸入的電信號轉化為光信號。
(5)交換機,采用中興的ZX210-2950,接收快速以太網收發器和光電轉換器T651終端的信號,與服務器相連,將數據存儲至服務器中。
硬件設計結構如圖6所示。
4.3.1 S60軟件
S60是S930智能噪音振動傳感器的軟件部分,它采用基于內核的嵌入式實時操作系統。在CPU的軟件設計過程中,主要采用模塊化的設計方法,優點是降低模塊間的耦合度,提高軟件復用性。整體的軟件架構包括驅動層、系統層和應用層三部分。

圖6 硬件設計框圖
在本系統中主要實現對噪聲信號和振動信號的采集、計算和傳輸任務,應用任務工作流程如圖7所示。

圖7 S60軟件流程圖
在噪音處理中,采用無限脈沖響應(Infinite Impulse Response,IIR)數字濾波器算法計算Z、C、A頻率計權的連續等效聲壓級,使用實序列快速傅氏變換(Fast Fourier Transformation,FFT)算法分析噪聲頻譜[13]。
根據國家標準《JJG 188—2002,聲級計檢定規程》可知,C計權C(f)可用如下公式計算:

任何頻率上的A計權A(f)可用如下公式計算:

在以上公式中,C1000和A1000表示常數,C1000=-0.062 dB,A1000=-2.000 dB。 f1到 f4取近似值為:f1=20.6 Hz,f2=107.7 Hz,f3=737.9 Hz,f4=12 194 Hz。
由式(1)推導出C頻率計權的傳遞函數為:

表1 計算誤差

由式(2)推導出A頻率計權的傳遞函數為:

雙線性變換公式和預畸變公式為:

以上i=1,2,3,4,fs表示采樣頻率,fs=48 kHz。
將式(5)和式(6)代入式(3)、(4)中推導可得C、A、Z計權等效連續聲級公式。
在振動處理中,本文采用基于最小均方差思想的有限長單位沖擊響應(Finite Impulse Response,FIR)濾波器的方法設計了一種新型的微分器;在設計積分器時,首先采用維納濾波器進行濾波處理,以提高信號的信噪比,再采用梯形積分法進行積分,但積分后的信號中原始信號中直流量所引起的趨勢項,采用最小二乘法消除了一次趨勢項,其積分算法原理如下:
設加速度連續周期信號為x(n),它的頻譜為X(k),根據傅里葉變換定義的諧波信號時域和頻域的對應關系,設 x(n)、v(n)、d(n)為加速度信號 x(t)、速度信號 v(t)、位移信號d(t)的離散化表示,每條譜線對應時域中的一個正弦波,表達式為:

進而有:

在式(7)~(11)中,wk=2πkΔf,Δf=Fs/N。由式(10)、(11)計算出速度離散信號v(n)、位移離散信號d(n)后,再根據均方根值即可計算出相應的有效值[14]。
與其他算法相比,以上算法精度相對較高[15],計算誤差如表1所示。
表1中的誤差為不同頻率信號下的最大誤差,由表可知,噪音和振動的測量精度完全滿足國家一級標準,已經在中國賽寶實驗室(工業和信息化部電子第五研究所)計量檢測中心取得了檢定認證。
4.3.2 FFT分析儀
FFT分析儀安裝于大數據服務器中,它基于LabView軟件平臺。首先,依次讀取待分析的機組號、設備號、測試單元、數據源,如#6機組6B風機第1路振動,加載相應的界面;然后,選擇起始日期和采樣頻率,判斷是否按下載入鍵,若是,連接數據庫,讀取相應設備在那個時間段的數據,若不是,則繼續等待;數據載入后,對數據進行解析,解析后對數據再進行FFT分析;最后,界面上顯示出原始波形以及分析處理后的波形、頻譜圖、功率譜、3D瀑布圖。軟件流程圖如圖8所示。

圖8 FFT分析儀軟件流程圖
2015年9月,該系統已經在某電廠安裝實施,由于輔機設備分布廣,結構復雜,數量多,種類多,相應的監測點非常多,現列出部分具有代表性的應用現場,如圖9所示。
系統安裝運行以來,取得了以下應用成效。
(1)實現了對電廠輔機設備的#5、#6機組的41臺輔機設備狀態監測流數據的采集。共計208個數據采集點,每分鐘數據總量為982.88 MB,每天數據總量為1 382.17 GB,每月數據總量為40.49 TB。
(2)實現了對輔機設備狀態監測海量數據的實時處理,以1 s為計算周期,計算得到噪音的A、C、Z值和振動速度v、加速度g、位移s值,以及全頻譜數據,形成針對特定運齡、工況、環境條件下輔機設備運行特征參數的判斷、預測和預警處理。
(3)實現了海量流數據的通信傳輸。兼容ModBus、DNP和IEC870-5-104、IEC61850協議,提供100 Mb/s雙光纖/電網絡、CAN、RS485和WiFi、GPRS接口,解決了丟包問題,保證了數據的完整性。

圖9 應用現場
(4)實現了海量數據的存儲和并行查詢。研制了大數據服務器,搭建分布式、高性能、可伸縮的數據存儲系統,實現對狀態監測動態信息的存儲和并行查詢,構建低成本、高效率的輔機設備大數據挖掘與分析研究平臺。在該平臺上,可對海量數據進行數據挖掘和建模,從而發現隱藏在海量數據中的豐富、有價值的信息,滿足對輔機設備進行更深層次研究的需求。
(5)建立了輔機設備大數據分析模型。研制了一套基于大數據全頻譜FFT和2D、3D趨勢分析軟件,建立了輔機設備振動噪音的檢測標準、實測的大數據記錄庫和事故隱患的診斷預警、壽命預測的大數據分析模型。
(6)實現了在線遠程監測?;诨ヂ摼WWeb應用體系架構,電廠監測中心可通過互聯網或移動互聯網登錄在線監測系統,從而可在線實時查看輔機設備#5、#6機組運行狀態和預警信息,如圖10所示。
該系統大大提高了機組的安全可靠性。在系統的長期運行過程中,系統多次發現輔機設備存在的潛伏性故障,電廠電氣工程師根據預警信息到現場進行診斷,發現確實存在相應的潛在性故障,對機組采取果斷、及時、正確的操作,并對該機組采取相應的跟進措施,避免事故的發生;同時,該系統建立的輔機設備振動噪音的研究平臺,存儲了輔機設備運行過程中的海量原始數據,提供了大數據分析工具,可作為輔機設備的故障診斷、故障定位等深入研究的基礎,供電力行業相關研究人員使用。該系統大大降低了研究人員研究過程中獲取實驗數據的成本,提高了研究人員的研究效率,促進了對輔機設備的深入研究。

圖10 基于Web的在線監測系統
輔機設備振動噪音的研究平臺之所以能夠開發成功并快速實現規?;瘧?,主要得益于以下幾方面:第一,目標明確,建立可應用于輔機設備的噪音振動大數據研究平臺,滿足發電廠對輔機設備進行狀態監測以及研究分析的業務需求;第二,勇于創新,在技術層面取得重大突破,將大數據技術應用于系統中;第三,團結協作,技術骨干聯合攻關。
本文通過對目前輔機設備狀態監測研究現狀的分析,發現主要存在以下三方面的技術難題。第一,如何實時地處理監測過程中采集到的海量數據流,快速生成分析結果;第二,如何存儲、查詢海量數據,從中挖掘出有價值的信息;第三,如何解決各廠家在線監測裝置通信規約不統一、不透明,造成數據資源不能共享的問題,提高系統的開發性、通用性、易擴展性、易維護性,促進系統在電力行業的應用與推廣,促進該領域的智能化、數字化建設。為了滿足以上需求,本文創新地提出流式數據實時分析技術和實時批處理技術相結合的方式,以Storm+Hadoop大數據處理架構很好地解決了前兩個關鍵問題。為了解決第三個問題,本系統里的S930智能終端按照智能電網技術標準體系中的大機組設備狀態監測與故障分析系統技術標準進行設計,支持智能電網統一通信規約,通過IEC61850協議進行通信傳輸,實現數據資源共享,促進智能電網大機組設備狀態監測與故障分析領域的數字化、智能化建設。系統中的智能終端不僅可以應用于機組輔機設備,還可以應用于各種振動噪聲監測場合,根據監測場合的不同,可以很方便地對系統進行剪裁,增加或減少智能終端的數量來適應現場需求。這使得系統的開發性、通用性、易擴展性、易維護性大大提高,非常易于應用與推廣。目前,該系統已經成功應用于某電廠,取得了預期的應用效果,證明了該系統是可靠的。接下來,將在此基礎上開展更深層次的研究工作,具體內容如下:
(1)提出在大數據環境下的數據壓縮技術方案,提高傳輸海量數據的速度,降低海量數據對存儲容量的需求,緩解海量數據增長速度,在滿足數據處理分析速度的前提下,優化大數據平臺對系統擴容的需求,降低大數據平臺的軟硬件投入成本。
(2)設計一種適應同時接入不同類型的數據信號的同步采樣方法,避免相位和幅值隨著時間的積累產生嚴重誤差,保證大數據的數據質量,為輔機設備和變壓器的異常噪聲源識別定位研究提供可靠的數據基礎。
(3)開展對輔機設備中的風機和變壓器的異常噪聲源識別定位研究工作,建立異常噪聲源識別定位分析系統。該系統對空間中的一個觀察平面上的不同點的聲音強度進行掃描,繪制出一幅聲強的分布圖,將異常噪聲實時動態地呈現給觀測人員。
(4)對大數據進行數據挖掘,根據機組輔機設備類型、型號、狀態的不同,相應地提取出準確、有價值的數據進行分析,為設備檢修工作提供可靠、準確的數據支持,提高檢修效率,減少檢修成本,提高設備利用率,保證設備的安全性,總體上提升設備運行管理水平。
(5)將此系統應用于更多電廠的大機組輔機設備,根據各個電廠設備的不同,建立不同類別、不同型號、不同狀態的大數據庫,通過智能電網統一通信規約實現不同電廠的數據共享。
(6)完善大數據共享平臺,包括改進通信信息建設和數據安全性、隱私保護相關研究。
(7)國內外智能電網大數據的研究和工程應用剛剛起步,尚處于探索階段,如何將此領域的大數據接入智能電網,需要多方努力溝通,達成共識,共同消除存在的障礙,制定各方面的發展戰略。