趙猛,劉怡
(國網天津市電力公司信息通信公司,天津 300010)
數據采集是指通過傳感器及其他待測設備,將模擬信號從被測單元中提取出來的處理過程,其面向電量信號、非電量信號等多種采集對象。隨著電力信息改革的不斷發展,實現數據信息的多通道采集迫在眉睫。
數據備份是信息容災處理的基礎,是指針對信息傳輸故障進行的復制文件存儲行為。一般來說,待處理的信息文件越多,數據備份指令的執行也就越頻繁[1-2]。
在電力信息傳輸環境中,數據采集與數據備份是兩個相互關聯的研究課題,前者注重對于傳輸信息的按需提取,后者則可針對關鍵傳輸文件進行指向性存儲。
傳統電力調度數據網采集方案只能采集到廣域狀態下的電量數據信息,并不能實現對電力信息數據存儲開銷的有效節約[3]。而MEMD 和HHT 方法則注重對電力系統的低頻振蕩模式進行識別,雖然能夠實現數據文件的按需轉換,但對于信息參量所采取的壓縮比數值過小,并不能完全滿足電量信息數據的高效性傳輸需求[4]。
為解決上述問題,該文從信息量采集、數據資源備份兩方面同時入手,提出電力信息數據多通道采集與自動備份方法。
在電力信息傳輸環境中,數據參量的多通道采集包含電壓和電流有效值確定、畸變因數計算、功率因數計算三個基本處理環節,具體操作方法如下。
平衡電力信息系統中數據諧波之間的響應關系,是獲得多通道數據采集結果的重要處理環節。在頻率域環境中,為使電力信息數據多通道采集結果具有較高的應用價值,應同時對電壓與電流的諧波分量值進行求解,并將所獲數值結果分別相加,從而實現對電壓有效值、電流有效值的按需計算。
電壓有效值決定了電力信息數據的瞬時傳輸速率。在多通道環境中,受到電網覆蓋面積等因素的影響,該項物理指標的數值結果越大,相應情況下的信息數據輸出速率也就越快[5]。
設v代表電力信息數據的實時傳輸速率,βv代表不同傳輸速率下電壓信號的諧波分量值,Umax代表諧波電壓的最大表現數值,聯立上述物理量,可將電壓有效值表達式定義為:

電流有效值決定了電力信息數據的實際傳輸距離,在多通道環境中,該項物理指標的實時數值結果可隨電信號輸出量的變化而不斷波動,但最終會趨于持續穩定的表現形式[6]。設λ表示電流信號的諧波分量值,Imax表示諧波電流的最大表現數值,ΔW表示電力信息數據的實時變化量,聯立上述物理量,可將電流有效值定義為:

對于電力信息數據而言,信號量多通道采集結果始終受到電壓與電流有效值的直接影響。
電壓畸變因數是以電壓有效值為基礎的電量信息數據采集有效性衡量條件,就多通道傳輸環境而言,電網主機中存儲的信息數據量值越多,畸變因數的數值就越大[7]。
設φ代表電壓信號采集系數,代表電力信息數據的單位輸出均值,Umin代表諧波電壓的最小表現數值,聯立式(1),可將電壓畸變因數計算結果表示為:

電流畸變因數是以電流有效值為基礎的電量信息數據采集有效性衡量條件,能夠根據電信號數據的實際輸出水平,確定主機元件所具備的信息存儲能力,從而將待采集的信息參量平均分配至多個不同的通道體系中[8]。
設ξ代表電流信號采集系數,Imin代表諧波電流的最小表現數值,聯立式(2),可將電流畸變因數計算結果表示為:

在多通道傳輸環境下,畸變因數計算量的數值結果越大,最終所能采集到的電力信息數據也就越多。
功率因數是電壓畸變因數與電流畸變因數的乘積表現形式,決定了電網主機所具備的信息數據采集能力。若采取多通道同時開發的采集形式,則可認為所有數據信息的采集結果都是唯一且單向存在的[9-10]。
設ΔT代表電力信息數據的單位傳輸時長,在DU>DI的情況下,功率因數P的計算值結果偏大;而在DU<DI的情況下,功率因數P的計算值結果則偏小;只有在DU數值與DI數值基本相等的情況下,才能得到較為準確的P值計算結果。聯立式(3)、式(4),可將功率因數P表達式定義為:

功率因數計算項對于電力信息數據多通道采集結果的影響能力最強,因此在實施采集處理的過程中,應盡可能保證該項指標參量計算結果的真實性。
電力信息數據自動備份是在多通道采集基礎上對傳輸信息進行二次加工與處理,具體實施流程包含信息流量統計、數據模式匹配、備份編碼閾值計算三個操作環節。
在電力信息數據多通道傳輸環境中,由于各級信息量采集結果只能滿足最原始的數據請求操作,因此,需要在原有數據信息的基礎上,對相關傳輸參量進行二次備份處理[11]。
信息流量是與數據參量自動備份操作直接相關的干擾項指標,一般來說,隨著原數據信息編碼條件的改變,整個多通道電力通信環境會進入相對變動的存在狀態。在此情況下,若不能及時對傳輸參量進行采集與提取,不但會造成數據信息總存儲開銷量的增大,也會在一定程度上促使信息壓縮比數值趨于不斷下降的變化趨勢[12]。而信息流量指標的存在,不但能夠在最短時間內確定數據信息所處的實時傳輸位置,也能通過多通道感知的方式,實現對待備份參量的定向篩選,這也是數據信息存儲開銷結果能夠得到有效控制的最主要原因。設en代表n個不同的電力信息數據備份解碼系數,其中n表示電力數據信息量,聯立式(5),可將電力信息數據在備份過程中的流量統計結果表示為:

其中,χ表示電力信息數據的存儲量,f表示數據信息的實時傳輸量,表示n個備份解碼系數的物理平均值。由于所有電力信息數據都只能存儲在單一的備份空間中,所以信息流量值越大,備份空間中數據節點所具備的存儲能力也就越強。
數據模式匹配是實現電力信息數據自動備份的關鍵處理環節,在多通道采集條件的支持下,能夠挖掘到的數據信息總量值越大,最終能夠收獲的匹配模式也就越復雜,與之相關的備份結果也就越完善。在實際處理過程中,數據模式匹配結果能夠干預電力信息數據的實際挖掘強度,并可針對各級備份節點,生成多個不同的數據信息陣列,以供通信主機的直接調取與應用。
為獲得更為理想的電力信息數據備份結果,數據模式匹配處理應從信息對象之間的子串相似性入手,在排查傳輸參量之間模式共通能力的同時,建立定向的關系型映射,一方面能夠避免已備份數據、未備份數據之間出現混亂存儲的情況,另一方面也可在最短時間內獲得最為理想的數據模式匹配結果[13-14]。
設κ代表電力信息數據的實時排查系數,c代表信息數據共通參量,cmin和cmax分別代表信息數據共通參量的最小值和最大值,聯立式(6),可將電力信息數據備份處理前的模式匹配結果表示為:

其中,μ代表電力數據信息流量的統籌速率,mc代表不同信息參量下的定向匹配系數,ΔK代表單位時間內的電力信息數據傳輸量。在實際應用過程中,數據模式匹配結果將直接影響電力通信主機所具備的信息備份能力。
由于電力信息數據的實時存儲量較大,因此為獲得較為穩定的備份處理結果,應針對不同的信息參量進行按需編碼,并根據最終的編碼結果,確定閾值計算量的真實物理數值[15-16]。
規定在一個備份區段中,電力信息數據的單節點最大通過量只能達到,且隨著傳輸時間的延長,該項物理量的數值結果只會呈現不斷下降的變化趨勢。設τ代表電力信息數據的原定碼源值,聯立式(7),可將備份編碼閾值計算表達式定義為:

式中,θ代表預設的備份信息量上限編碼數值。按照上述操作流程,完成對既定信息數據的編碼與調度,再聯合已知的處理結果,完成對電力信息數據多通道采集與自動備份方法的設計。
電力信息數據的采集與備份性能通常以存儲開銷、壓縮比兩個指標來衡量,以實驗數據為基礎對上述性能指標進行詳細比較,并從中總結出相應的結論。
實驗組,首先對測試電力信息數據采取了三種不同的備份方式:該文方法、基于電力調度的數據采集備份方法以及基于MEMD 和HHT 的數據采集與自動備份方法,然后以實驗結果作為基礎,比較了三種方法在時間方面的總存儲開銷S(n)(即儲存空間占比),n為電力數據信息量,并分別引入了三者的理論值結果作為參照,其具體對比情況如圖1 所示。圖1 中,上述三種方法的總存儲開銷都隨著電力數據信息量的增大而增大,但是基于MEMD 和HHT 的方法和該文方法的增長趨勢明顯比基于電力調度采集方案更為緩慢。與該文方法相比,基于MEMD 和HHT 的方法雖未出現階躍式增長,但其變化曲線始終位于多通道采集與自動備份方法上端。綜上可證明,在所選取的三種方法中,該文方法具有最低的存儲開銷。

圖1 總存儲開銷對比
壓縮比能夠反映電力信息數據的壓縮程度。一般來說,壓縮比數值越大則代表所選用方法對于電力信息數據的采集與備份處理能力越強。表1 給出了當電力數據信息量n=3 399.86 MB 時所選取三種方法的壓縮比。

表1 壓縮比數值對比
分析表1 可知,在總存儲開銷量相對較小的情況下,上述三種方法的實驗壓縮比數值均高于理論壓縮比數值,其中基于MEMD 和HHT 的方法對于電力信息數據的壓縮能力最弱,其實驗壓縮比數值明顯低于另外兩種方法。該文方法對于電力信息數據的壓縮能力最強,與基于電力調度采集方法相比,其實驗壓縮比數值增大了1.42。綜上可知,在所選取的三種方法中,該文方法對于電力信息數據的壓縮能力最強,在信息實時處理方面的應用能力也最強。
電力信息數據多通道采集與自動備份方法從節約電力信息數據存儲開銷的角度入手,在保持高水平信息參量壓縮比數值的基礎上,根據電壓和電流有效值結果,對畸變因數與功率因數進行按需計算,再通過統計信息流量數值的方式,得到準確的備份編碼閾值結果。在實際應用過程中,該方法能夠以最低的開銷數值對電力信息數據進行存儲,不但能夠較好滿足實際應用需求,也可以將壓縮比指標控制在理想化的數值區間之內。