舒征宇,李黃強,丁紅聲,余振華,高 波,楊世勇
(國網湖北省電力公司宜昌供電公司,湖北 宜昌 443000)
隨著我國工業化進程的不斷加快以及經濟水平的不斷提高、電網建設不斷加強,電力網絡則越來越復雜,與之對應電網調度倒閘操作涉及到的一次、二次設備的操作愈加復雜。在運行方式倒換或事故處理時快速準確的發布電網調度操作指令顯得越發困難。因此越來越多的研究人員試圖將人工智能方面的研究成果應用于該領域,建立以人工智能為基礎的電網操作規則庫,從而輔助電網倒閘操作,提升操作指令準確率。
目前,我國的電網調度采取分級管理,各級電網對應各級調度,具有責任明確、對事故響應快速等特點[1-2]。然而由于各級(或各地區)電網根據地域特點和設備特點分別制定其調度規程,導致同一操作在國內不同地域的電網中調度操作步驟、內容以及操作指令票的填寫標準存在差異(即電網倒閘操作規則存在差異)[3]。為此,現在關于操作指令票檢驗相關研究中較為普遍的做法是:先讓程序員理解電網調度規程,然后以程序員理解的邏輯建立相應的規則庫[4]。但是這樣處理不能解決不同地域的調度規程存在差異的問題,不能廣泛推廣,并且通過這種方式形成的規則庫的準確性受到程序員理解準確程度的制約,當調度規程修編后,規則庫不能及時更正。
鑒于此,本文提出一種基于數據挖掘的電網倒閘操作規則庫建立方法,以歷史操作指令票為依據,采用數據挖掘的方法挖掘電網倒閘操作的操作規則,根據不同地域的歷史操作指令票挖掘形成不同的操作規則庫,從根本上解決了地域差異的問題。
常見的分類規則挖掘所涉及的挖掘樣本其屬性是固定的[5],針對屬性取值規律進行分析從而形成相對固定的分類規則,其形式如下(見圖1)。

圖1 分類規則挖掘一般形式Fig.1 The general form of classification rules mining
然而對于電網操作規則的數據挖掘而言,其挖掘的數據樣本為歷史存檔中的大量操作指令票,每張操作指令票中涵蓋的操作內容和操作步驟則會依據操作任務的復雜程度和邊界條件(即電網實時的運行狀態)而發生改變[6]。為此本文首先對挖掘對象的數據樣本(即歷史存檔的操作指令票)進行預處理。
建立與電網一次設備實際結構相符的網絡拓撲模型,其簡化標準為:將母線、斷路器、變壓器作為節點,將輸電線路等效為網絡拓撲模型中的邊。增加斷路器和母線、線路之間的虛擬連接并簡化為網絡拓撲模型中的邊,增加母線和變壓器之間的虛擬連接并簡化為網絡拓撲模型中的邊。由此可以得到表征電網中電氣設備連接關系的連接矩陣

式中:G0為電力系統的將電力網絡抽象得到的簡單圖,eij為節點i到節點j的邊,n為電網中母線、斷路器、變壓器的個數之和。該矩陣描述了電網中一次設備之間的連接關系。在此基礎上對連接矩陣A0中的對角元素進行賦值,得到反映電網一次設備運行狀態的網絡狀態矩陣

同時,建立與電網一次設備運行狀態相對應的二次設備運行狀態向量χ。

通過上述三個步驟,實際電網中一次設備與二次設備的運行狀態以及整個電網的連接關系可以由網絡狀態矩陣A和二次設備運行狀態向量χ表示。
根據操作步驟拆分操作指令票。一張完整的操作指令票包含兩個部分:1)操作任務,表示操作指令票需要達到的目的。2)操作內容,表示具體的操作步驟。本發明根據操作內容中的步驟來劃分操作指令票,同時為保障拆分后得到的操作項目盡可能多的包含原操作指令票的內容,將電網操作指令票進行劃分表示為如下形式:

式中:S為操作指令票,表示為操作項目的集合,θ為標準化處理后的操作項目。若操作指令票S由n個操作步驟完成,那么該操作指令票則可以劃分為n個操作項目 {θ1,θ2,…,θi,…,θn}。θ為劃分后得到的操作項目(對應于原操作票中的操作步驟),由五維向量表示,其中M為原操作票的操作任務,A為進行該操作前電網的一次設備運行狀態矩陣,χ為進行該操作前的電網二次設備運行狀態向量,B為該操作項目對應的操作內容(下文簡稱本項操作內容),N為原始操作指令票中下一項操作項目的操作內容(下文簡稱下項操作內容)。
采用以上步驟進行預處理后的操作票可以表示為有關聯關系的操作項目,并且每個操作項目有且僅有五個屬性。
蟻群算法是通過模擬螞蟻覓食尋找最優路徑的方式來求解的一種算法[7]。螞蟻在覓食過程中會在經過的路徑上留下信息素,而后跟進的螞蟻會有極大幾率跟隨信息素前進。蟻群算法的本質則是設置虛擬螞蟻和螞蟻向不同節點移動的幾率來指引路徑尋找,通過多次迭代收斂來進行路徑優化[8]。而電網調度倒閘操作的規則挖掘則可以看作蟻群對覓食路徑的尋找。蟻群算法的數學模型可以表示為下式:

式(9)表示螞蟻k在t時刻從節點i向節點j移動的的幾率[9],即操作項目i后執行操作項目j的幾率,S為所有操作項目的集合。τij(t)、ηij分別為t時刻的局部信息素和啟發因子,即局部尋優和全局尋優的影響因子,Δτij(t)為全局信息素。本文α=0.7、β=0.3、ρ=0.5,令局部信息素為

P(Ni=Bj|Bi)為所有操作項目的集合中,操作項目i執行后執行操作項目j的概率。式中ψ|Bi為操作項目集合中本項操作內容為Bi的操作項目個數,ψ|Ni=Bj則為本項操作內容為Bi且下項操作內容為Ni(其中Ni=Bj)的操作項目個數。
令全局信息素為

其中X,Y為一次狀態矩陣和二次狀態向量的皮爾森相關系數,分別表示操作項目i執行前和操作項目j執行前電網一次設備運行狀態相似程度和二次設備運行狀態相似程度。由于每個操作項目θ只代表單一的操作,相鄰的兩次操作之間電網的設備運行狀態會十分接近,以兩個操作項目的電網運行狀態的皮爾森相關系數作為全局信息素可以在迭代過程中快速剔除不相關的操作項目,加快迭代收斂。
令啟發因子為

即所有操作任務為M的操作項目中本項操作內容為Bj的概率。其大小為操作任務為M且操作內容為Bj的操作項目個數除以操作任務為M的操作項目個數。
采用以上算法對路徑進行搜索直到最新搜索到的操作項目中“下項操作內容”為空,則停止搜索并形成一條路徑。經過迭代使得路徑收斂得到一條分類規則,記作R[θ],其實質為操作項目的組合序列。
以操作項目集合S中的每個操作項目為起點,采用3.1所述的搜索方法,可以得到對應的分類規則R=[θ1,θ2,…,θi,…,θn]。而這樣搜索得到的規則中會存在大量的重復。為此還需要對規則進行修剪[6],其步驟如下。
步驟1計算規則有效性,規則的有效性Q可以用下式進行計算。

式中:tp為規則前件后件都適合的樣例數;fp為規則前件適合后件不適合的樣例數;fn為規則前件不適合后件適合的樣例數;tn為規則前件后件都不適合的樣例數。
tp、fp、fn、tn的具體數值可以通過將挖掘得到的規則R[θ]在歷史操作票中檢驗計算得出。
步驟2規則剪枝。通過刪除任何能導致規則精度提高的前件來修剪規則。剪枝后的規則就是搜索到的規則。其具體方法為,依次移去能使規則有效性得到最大提高的節點(即規則中的操作項目θ),直到任意一個節點的移去將降低規則有效性。
基于規則挖掘的電網倒閘操作規則庫建立方法實施步驟如下:
a)建立電力網絡拓撲模型,將母線、斷路器、變壓器作為節點;將輸電線路等效為網絡拓撲模型中的邊。增加斷路器和母線、線路之間的虛擬連接并簡化為網絡拓撲模型中的邊,增加母線和變壓器之間的虛擬連接并簡化為網絡拓撲模型中的邊,形成可以表示電網連接關系的網絡拓撲模型,記作A0。可參見式(1)與式(2)。
b)根據一次設備的運行狀態,采用公式(3)、(4)為網絡拓撲模型中的對角元素賦值,形成一次設備運行狀態矩陣,用以表示對應一次設備的運行狀態,記作A。
c)電網的二次設備都會配合一次設備運行,在進行電網倒閘操作時會涉及到一次與二次設備的操作。因此,為表征二次設備的運行狀態,根據式(5)、(6)建立與一次設備運行狀態矩陣相對應的二次設備運行狀態向量,記作χ。
d)電網操作指令票都是逐項填寫,每一步只含有對一個設備的操作內容。可以按照操作步驟進行劃分,將任意一張操作指令票劃分成對應的操作內容。
e)為保障每個數據樣本盡可能多的含有全局信息,將本項操作內容、下一項操作內容、原始操作票的操作任務、執行該操作的網絡一次設備狀態矩陣、執行該操作的網絡二次設備狀態向量五項屬性組合形成標準化的數據樣本,稱作“操作項目”。
f)從操作項目集合中選取一個操作項目作為起點,由式(12)~(14)采用蟻群算法計算螞蟻向下一個操作項目移動的幾率,即某一次單項操作后下一項操作的幾率。
g)每只螞蟻在搜索過程中,直到搜索到的最后一個操作項目k中Nk=Bk。表示一條完整的路徑搜索完成。
h)采用式(9)、(10)進行迭代直至收斂,得到一條路徑(即規則),并將其輸入規則庫。
i)根據式(15)為計算規則有效性,式中tp、fp、fn、tn的具體數值可以通過規則R[θ]在歷史操作票中檢驗計算得出。
j)刪除規則R[θ]中的節點,即規則中的操作項目,重新計算規則的有效性。若存在有效性降低的情況則恢復刪除,將修剪后的規則計入規則庫;若不存在有效性降低的情況則繼續刪除節點,直到所有節點檢驗完畢。
本文提出的一種基于規則挖掘的電網倒閘操作規則庫建立方法將數據挖掘引入到電網調度領域中,在對歷史存檔的電網操作指令票進行預處理的前提下,采用蟻群算法搜索潛在的分類規則,并通過規則有效性指標對規則進行剪枝形成規則庫。本文所提出的方法可以適用于不同地域,有效避免了地域差異導致的規則庫兼容性等問題,可以廣泛應用于電網操作指令票的自動檢驗系統和自動生成系統;更好地輔助電網操作指令票的審核,不僅節約了相關輔助系統的開發成本,同時可以有效提高電網操作指令票審核效率和正確率,減少電網操作中的誤操作,避免經濟損失。
[參考文獻](References)
[1]王晶晶,劉巍,張勇平,等.華北電網無人值班站和集控中心管理模式的探討[J].華東電力,2011(10):23-24.Wang Jingjing,Liu Wei,Zhang Yongping,et al.Re?search on management of control center in North China Power Grid unmanned station[J].East China Electric Power,2011(10):23-24.
[2]黃煒,張杰明,綦孝文,等.調度集控一體化系統責任區管理和告警解決方案[J].電網技術,2012(7):41-45.Huang Wei,Zhang Jieming,Nie Xiaowen,et al.Solu?tions of localization responsibility and alarm man?agement with dispatching integrated[J].Power Sys?tem Technology,2012(7):41-45.
[3]張良棟,石輝,張勇軍.電網事故原因分類淺析及其預防策略[J].電力系統保護與控制,2010(4):43-47.Zhang Liangdong,Shi Hui,Zhang Yongjun.Analysis of grid accident and its preventive strategies[J].Power System Protection and Control System,2010(4):43-47.
[4]郭惠.調控一體模式下電網事故拉荷方案討論[J].科技促進發展,2011(11):77-81.Guo Hui.Load shedding program discussed under the dispatching integrated[J]Science and Technolo?gy for Development,2011(11):77-81.
[5]李杰,徐勇,王云峰,等.最簡關聯規則及其挖掘算法[J].計算機工程,2007(13):77-81.Li Jie,Xu Yong,Wang Yunfeng,et al.The research on association rules mining algorithm with the most simple rules[J].Computer Engineering,2007(13):77-81.
[6]徐久成,史進玲.一種粒計算中決策規則的提取[J].計算機工程與應用,2009(25):96-101.Xu Jiucheng,Shi Jinling.Research on extraction of decision rules with particle swarm optimization[J].Computer Engineering and Applications,2009(25):96-101.
[7]陸媛,楊慧中.基于代表熵的基因表達數據聚類分析方法[J].計算機工程與應用,2008(27):56-60.Lu Yuan,Yang Huizhong.Research of cluster analy?sis of gene expression data based on representative entropy [J].ComputerEngineering and Applica?tions,2008(27):56-60.
[8]李小梅,郭紅.基因表達數據的模糊聚類技術研究[J].信息系統工程,2013(11):36-41.Li Xiaomei,Guo Hong.Study of fuzzy clustering analysis based on gene expression[J].Information Systems Engineering,2013(11):36-41
[9]柴寶杰,劉大為.基于粒子群優化的蟻群算法在TSP中的應用[J].計算機仿真,2014(8):16-18.Chai Baojie,Liu Dawei.The research on application of ant colony algorithm in TSP based on particle swarm optimization [J].ComputerSimulation,2014(8):16-18.