王普專 鄔 桐 周 磊 張春香 吳飾斐
1(國網福建省電力有限公司技能培訓中心 福建 泉州 362000)2(東北大學 遼寧 沈陽 110819)3(國網遼寧省電力有限公司經濟技術研究院 遼寧 沈陽 110015)4(北京科東電力控制系統有限責任公司 北京 100192)
伴隨電力系統逐漸向大電網與高壓電方面快速發展,用戶對供電質量的需求也逐漸向高度可靠性靠攏。電力暫態信息存在比基波分量更豐富的故障信息,暫態信息的檢測屬于保護電力系統、定位故障的核心問題[1]。
由于故障暫態行波在線路中運行時存在非線性衰減問題,它的故障暫態信息未能完全被應用。如果可以完全發掘暫態波形的核心暫態數據,完成暫態故障情景透明式,便能夠對故障原因實行高精度判定,讓后續的輸電線路優化與防御工作更具備針對性。輸電線路故障所存在的暫態行波具有大量故障信息,比如極性、行波幅值、故障時間、故障方位、過渡電阻等[2]。以上故障信息屬于輸電線路故障診斷的核心憑據。當下國內外相關研究人員的分析大多集中于故障點暫態波形特征參數的提取,但是針對故障角、過渡電阻等暫態信息的提取,還未形成針對性的方法,此類暫態故障信息屬于輸電線路的故障原因判斷的核心依據。為此,本文提出基于FP-growth算法的輸電線路短路故障關鍵暫態信息檢測方法,創新之處在于將基于FP-growth算法的頻繁項挖掘方法應用于電力系統中,FP-growth算法能夠快速采集相關數據,以免采集不相關數據對后期暫態信息提取存在干擾。當FP-growth算法采集輸電線路頻繁出現短路故障的線路信息后,通過故障關鍵暫態信息提取方法檢測該輸電線路短路故障角、過渡電阻等暫態信息,實現輸電線路短路故障關鍵暫態信息的準確檢測[3]。
步入大數據時期,數據挖掘方法在互聯網檢索引擎、醫藥科學等很多領域被大量使用,主要用于在海量數據里發掘內在規律關聯性、非無用信息。FP-growth算法屬于數據挖掘方法在關聯規則發掘領域的核心內容,能夠快速挖掘數據集合中的頻繁項集和數據間潛在關聯規則。本文所用基于FP-growth算法的頻繁項挖掘方法由FP-tree的構建和遞歸挖掘FP-tree兩部分組成[4]。
1.1.1確定FP-tree支持度
FP-tree是一種輸入數據的壓縮表示法,它通過逐個讀入事務,并把每個事物映射到FP-tree中的一條路徑來構造。由于不同的事物可能會有若干個相同的項,因此它們的路徑可能部分重疊。路徑相互重疊越多,使用FP樹結構挖掘的輸電線路短路故障關鍵暫態信息效果越好。
設h={i1,i2,…,im}是由m個項組成的故障信息集合,D是一組輸電線路短路故障數據集且D中事務數據都由h中的項組成。給定項集X?h在D中的支持數是指D中包含X的信息數,X在D中的支持度是指X的支持數占D中所有事務數的百分比。
定義1對于項集X?h,若X在D中的支持度sX大于等于給定的最小支持度s,則稱項集X為事務數據集D在最小支持度s下的頻繁項集。
定義2對于項集X?h,給定最小支持度s,若X的所有超集都是非頻繁項集,則稱項集X為事務數據集D在最小支持度s下的最大頻繁項集。
若R={n1,n2,…,nm}為FP-growth數據集D生成的FP-tree中的一條路徑,所有項集和路徑都是按照支持度降序排列的。
證明:根據集合的性質容易得證,若X?R,由于所有項集和路徑都是按照支持度降序排列的,則X?R。
通過上述證明可知,采用FP-tree的挖掘結構自頂向下的搜索策略,采用雙重循環的方式挖掘最大頻繁項集,若數據項集的支持度大于等于最小支持度閾值,則FP-tree適用于輸電線路故障診斷中。
1.1.2基于數據集合構建FP-tree
FP-tree屬于FP-growth算法的非常規數據結構,可保存輸電線路短路故障原始數據中的相關數據,只采用2次數據掃描,便能將輸電線路短路故障原始數據里的事務壓縮至一個FP-tree中,此FP-tree與前綴樹相似,相同前綴路徑可通用,以此實現輸電線路短路故障數據壓縮[5]。
假定輸電線路短路故障數據集A={a1,a2,…,am},a屬于其中一條事務;隨機事務aj屬于輸電線路短路故障多元素構成的組合,a2={b1,b2,…,bu},bu表示事務里的元素,本文將A設成例子,描述FP-growth的建立流程。
(1) 首次遍歷輸電線路短路故障數據集A,記載產生各個元素項bu的機率gu。把每個元素根據gu減序分布,之后把每個元素項bu標識信息和存在機率gu存儲在頭指針表Tabhead里;提前設定最小支持度gmin,如果gu (2) 再次遍歷輸電線路短路故障數據集A,對A中各個子集aj實行篩查與排序。先把aj里gu (3) 通過AM建立FP-tree。自空集開始,把AM中的每個事務aj逐個加入樹中。先確定FP-tree里是否含有與事務aj一樣的前綴分支:如果含有,那么共同前綴分支存在輸電線路短路故障檢測節點的元素項計數值需要加1;如果不含有,那么在共同前綴分支最后一個節點的子節點上構建新分支,新分支含有節點計數值是1。全部事務aj遞歸,直到FP-tree建立。 輸電線路短路故障數據集合A中存在9個事務,當中:a1={b1,b2,b3,b4},a2={b2,b3,b4,b5},a3={b2,b3,b4},a4={b1,b2,b3,b4,b5,b6},a5={b1,b3,b6},a6={b2,b3,b6},a7={b1,b3,b4},a8={b1,b2,b3,b4,b7},a9={b1,b2,b4,b7}。 將最小支持度設成gmin=3,根據以上步驟建立FP-tree。圖1中的頭指針表中存在輸電線路短路故障數據集的元素項和衍生次數,同時根據曲線連接FP-tree里全部相同元素項;直線相連節點描述父代和子帶關系,父代至上[7]。 圖1 FP-tree結構 1.1.3基于FP-tree挖掘頻繁項集 為提升實際效率,先將Apriori算法與FP-tree結合使用,先進行Apriori算法挖掘,找出滿足最小支持度的所有頻繁項集,再將由頻繁項集滿足最小支持度和最小置信度要求的數據項相關聯。Apriori算法主要集中在如何快速有效地找出滿足最小支持度的所有頻繁項集,Apriori算法需要多次重復地掃描數據,并產生大量的候選項目集來找出所有的頻繁項集,因此,算法在時間和空間上的開銷太大。為了克服這些不足,使用FP-tree進行挖掘。 頻繁項集發掘的中心思想為遞歸挖掘,發掘每個元素項的條件模式基并建立條件FP-tree,在遞歸時發掘頻繁項集[8]。設定條件模式基是基于某輸電線路短路故障元素項為收尾的路徑組合,路徑中包括了此元素項和根節點間的全部子節點項。設定條件FP-tree是根據某元素項的條件模式基,是輸入數據建立的FP-tree。詳細流程如下: (1) 在FP-tree里得到輸電線路短路故障某元素項的條件模式基。在頭指針表某元素項bu指向的首個節點開始,遍歷此元素項在FP-tree里具有連接關系的全部節點[9]。每逢一個輸電線路短路故障檢測節點,可實行依次上溯,同時記載此節點到根節點間存儲的全部元素項,衍生一個前綴路徑,將此前綴路徑設值,此值與第一個節點元素項計數值相等。此元素項的剩下前綴路徑集合屬于輸電線路短路故障條件模式基[10]。 (2) 通過輸電線路短路故障條件模式基建立條件FP-tree。先構建輸電線路短路故障的頻繁項集列表,同時把bu導進頻繁項集列表里,之后將根節點設成bu,將與bu相符的條件模式基設成輸入數據,建立FP-tree,獲取結果屬于bu的條件FP-tree(條件FP-tree根節點從空集變成bu)。把條件FP-tree里的元素項(不包含根節點)依次放進輸電線路短路故障的頻繁項集列表里[11]。 (3) 遞歸發掘條件FP-tree里的頻繁項。將條件FP-tree里輸電線路短路故障每個元素項(不包含根節點)遞歸得到條件模式基,建立條件FP-tree,存儲輸電線路短路故障的頻繁項,當FP-tree只具有一條分支便停止遞歸,獲取最后的輸電線路短路故障頻繁項集列表,此列表存儲具有bu的頻繁項。 (4) 將頭指針表里的元素項根據支持度實行升序分布[12],之后將各個元素項進行步驟(1)-步驟(3)處理,獲取輸電線路短路故障每個元素項的頻繁項集,此項集即為頻繁出現故障的輸電線路,也稱故障線路。 1.2.1故障行波傳播過程 圖2是故障線路模型。 圖2 故障線路模型 故障出現方位存在三種狀況: (1)c1、c2之間。 (2)c1、c2或者d1、d2之間。 (3)C、c2或者D、d2之間。 文章圍繞故障點在兩個監測點c1、d1之間實行分析。在C側設定監測點c1、c2;基于D側設定檢測點d1、d2。C、D依次描述兩端母線,c1、c2之間間隔是eC,d1、d2之間間隔是eC|D|。 若點d2至母線D的間隔是edD,點c1、d1至故障點g1間隔是ecg1、edg1,c1至母線C間隔是ecC,按照d1、d2檢測的行波第一個波頭,能夠反演獲取故障點的初始線模電流行波,其幅值設成LQ。 因為線模波速不小于零模波速[13-14],在研究行波第2個波頭過程中,不分析首個行波的零模分量經過母線反射后抵達d1、d2的行波。這時d1、d2檢測的線模電流行波第2個波頭能夠通過下述兩種狀況出現: (1) 首個行波通過母線C反射,然后通過故障點折射抵達d1、d2。 (2) 首個行波通過母線D反射,然后再傳輸至d1、d2。 假定ecC+eC+ecg1 如果間隔符合ecC+eC+ecg1 如果ecC+eC+ecg1>edD+ed,則將c1、c2與d1、d2互換,研究方法與上述一樣。可建立目標函數,判斷故障點的故障電阻和故障角情況,完成關鍵故障信息的詳細分析。 1.2.2目標函數建立 綜上所述,建立目標函數的原則是為了降低輸電線路短路故障反演獲取的行波幅值和理論運算的行波幅值差異。以Z相接地、MN相間短路、MN相接地短路為例,建立目標函數是: (1) (2) (3) 式中:V表示輸電系統各項電壓的最大值;φMN描述MN線電壓故障初始角;φM、φN、φZ描述電壓故障初始角;Wf描述故障電阻;i代表模量標號;LQi是按照d1、d2檢測獲取的第一個波頭反演獲取的故障點電流行波幅值;Lqi代表按照c1、c2檢測獲取的第2個波頭正演獲取的電流行波幅值;Lsi為根據d1、d2檢測到的第2個波頭正演求取的電流行波幅值;r為故障初始角;S0、S1、S2是經過反演參數運算獲取的輸電線路短路故障關鍵暫態信息波阻抗。則針對目標函數P(PZ、PMN、PMNH)來講,只有故障電阻和故障初始角屬于未知參量。所以,P表示相應的故障暫態信息。 實驗使用21臺服務器建立某電力公司輸電線路短路故障的并行計算環境,分別模擬覆蓋較廣范圍輸電線路以及較長時間的輸電線路。服務器的主頻是2.41 GHz,操作系統是64位的Debian Linux。通過IBM DataGen[15]創造輸電線路短路故障測試數據集,在當前模擬環境中,存在的項目總數是1 000種,各條記載的長度均值是10,隨機選取數據參數進行仿真實驗。 采用本文方法檢測實驗輸電線路不同短路故障情況的關鍵暫態信息,測試本文方法的檢測效果,結果如表1所示。 表1 不同故障情況下本文方法應用效果 續表1 根據表1數據顯示,本文方法檢測結果中故障角的誤差最大值是0.79°,這時真實相角是91°;故障電阻的誤差最大值是1.5 Ω,這時真實電阻是11 Ω。由此可知,本文方法的魯棒性較優,在不同故障環境中均能夠準確檢測輸電線路短路故障關鍵暫態信息。 為了進一步判斷本文方法的應用性能,設定暫態信息種類依次是A:斷路器操作、B:電容投切、C:單向短路、D:一次電弧、E:雷擊。采用本文方法、基于行波反演的輸電線路單相接地故障重演方法,以及基于奇異值分解理論的輸電線路故障檢測方法對五種故障關鍵暫態信息進行檢測,三種方法對五種故障關鍵暫態信息的檢測結果對比見表2。 表2 三種方法對五種故障關鍵暫態信息的檢測結果對比 分析表2可知,三種方法對比之下,本文方法檢測輸電線路五種短路故障關鍵暫態信息時,對單向短路、一次電弧、雷擊三種短路故障關鍵信息檢測所耗費的時間最短,且與理論時刻相同,表明本文方法在檢測輸電線路短路不同故障關鍵暫態信息時的效率較快。 三種方法檢測暫態信號的誤差測試結果如表3所示。 根據表3數據可知,當需要檢測的輸電線路短路故障關鍵暫態信息是斷路器操作和電容投切所導致時,本文方法的檢測誤差最小,僅有0.000 006,另外兩種方法的檢測誤差均為0.000 013;而在剩余三種情況下,本文方法的檢測誤差僅有0.000 001,則本文方法檢測精度最高。 設定海量輸電線路短路故障信息,測試三種方法在大量故障數據檢測結果,見圖3。 圖3 三種方法抗干擾性測試結果 根據圖3可知,本文方法的檢測數據量最大值高達0.97 GB,另外兩種方法的檢測數據量最大值依次是0.88 GB、0.86 GB。對比可知,本文方法的檢測能力優于常規兩種方法。 輸電線路出現故障后的暫態行波屬于一個具有突變型、奇異性的信號,準確檢測輸電線路短路故障關鍵暫態信息能夠有效發掘輸電線路短路故障問題。本文提出基于FP-growth算法的輸電線路短路故障關鍵暫態信息檢測方法,在不同故障環境中均能夠準確檢測輸電線路短路故障關鍵暫態信息,且在檢測輸電線路短路故障信息時,本文方法的故障信息檢測時間和故障節點數據量存在線性關系,具有較高的加速比;本文檢測輸電線路故障關鍵暫態信息時檢測精度高,在增強電網供電可靠性、避免大停電事故方面具有重要意義。
1.2 輸電線路短路故障關鍵暫態信息提取




2 仿真實驗分析
2.1 實驗準備
2.2 多數據下設計方法實驗結果與分析


2.3 多檢測狀態下測試結果

2.4 誤差測試
2.5 大量故障信息下測試結果

3 結 語