張照鑫,朱允剛,虞玉峰,趙山博,張勝男,陶紫涵
(吉林大學 計算機學院,吉林 長春 130023)
電能表是每家每戶都會使用的電子測量儀器,而智能電表已經和傳統電表有了很大的不同,它的功能有本地數據處理、遠程數據通信以及電網運行參數采集等。同時智能電表質量以及運行狀態直接影響到采集系統的穩定性和安全性,而現有針對智能電表狀態評價方法的研究較少,大量的質量數據和監測數據并沒有得到充分的價值挖掘和合理利用,國內的智能電表狀態監測技術仍處于起步狀態,因此,尋找一個合理化、高效化的智能電表評價方法就成為了重要的探索方向。
貝葉斯網是一種概率網絡模型,它以貝葉斯公式為基礎,基于概率推理,廣泛應用于人工智能領域,被認為是推理領域和不確定知識表達領域最有效的理論模型之一[1-3]。通過對智能電表運行過程中與運行狀態相關的多種數據的選取,根據貝葉斯網絡知識訓練有效模型,并利用集成學習方法融合構建最優網絡,作為評價智能電表運行狀態的高效模型[4],同時利用Visual Studio 2019實現評價算法,通過輸入其他相關方面運行數據推算智能電表各狀態概率,得出最符合實際的狀態評價,以此作為評價智能電表運行狀態的合理方法。
利用貝葉斯網絡進行智能電表的狀態評價就需要選擇準確的數據離散化方法以及高效合理的貝葉斯網訓練方法。而電能表狀態評價是典型的有序命題類問題,為此該文提出適用于智能電能表狀態融合的凸函數證據理論方法,結合選擇性集成學習方法進一步提高了狀態評價的準確性和科學性,最終實現對電能表狀態的高準確判定。
為了有效地進行智能電表狀態評價,根據生活經驗選取了基本誤差、有功準確度等級、運行誤差、運行時間、運行故障率、全檢退貨率、監測異常、安裝環境、用戶信譽、家族缺陷、狀態評分等相關因素[5](148),并結合智能電能表性能退化數據的典型時間點對應的可靠性值、實際驗證的運行狀態等數據組成電能表狀態評價數據集,并同時進行數據離散化。同時,為了提高準確度,運用集成學習思想,對訓練集進行R次采集m個樣本的隨機采樣,形成R組均包含m個樣本的數據集,分別對每組進行貝葉斯網絡數據訓練,同時根據數據訓練結果不斷修改貝葉斯網絡的結構,尋找最優的貝葉斯網絡模型[6]。然后利用聚類算法,對這R個貝葉斯網進行聚類,從中挑選出M個精度高,符合實際情況的貝葉斯網絡集合F,利用網絡集合F中的所有貝葉斯網作為融合模型,分別計算出智能電能表處于各評分狀態的概率值。基于凸函數的理論,對貝葉斯網絡進行有效融合,以此得到較為準確的最終狀態評價結果。設計的模型框架如圖1所示。

圖1 基于貝葉斯網絡的智能電能表狀態評價模型框架
為了數據表示和處理方便,將上述的基本誤差、有功準確度等級、運行誤差、運行時間、運行故障率、全檢退貨率、監測異常、安裝環境、用戶信譽、家族缺陷、狀態評分等相關因素表示為變量X1,X2,…,X11。
由于采集的智能電能表數據有一部分是一系列連續值,而貝葉斯網絡只能處理離散數值,所以首先要將數據進行離散化,離散方法[4](148)如下:

對于以上所有區間,設計處理算法,將任意兩個區間合并后成k-1個區間,計算出每個區間出現的概率,根據每個區間出現的概率值計算合并后的指標X的信息熵H(k-1),然后計算H(k)-H(k-1);計算任意合并情況下前后的信息熵之差,尋找出差值最小的合并策略作為本次合并策略[7-8]。若同時出現兩種或兩種以上差值最小的合并策略,則隨機選擇一種策略進行合并。根據合并后的信息熵H(k-1)計算Sj=(k0-1)×H(k-1)-(k-2)×H(k0),其中j的初始值為1;若Sj≤Sj-1,此時每個區間對應指標X的一個離散值。否則令k=k-1,j=j+1,重復上述操作[9]。利用Visual Studio 2019實現上述算法處理所得數據,部分連續數據離散化后結果見表1(表中數字代表數據所處離散后的區間)。

表1 部分連續變量離散表
將離散化后確定的指標屬性集合表示為變量集合X={X1,…,Xi,…,Xn}(n=11),基于預先采集的電能表運行狀態歷史評價數據,通過遺傳算法進行學習、訓練,結合集成學習思想,生成表示電能表數據和電能表狀態之間關系的貝葉斯網。
采用Bagging算法[10]從數據中訓練生成R個貝葉斯網的集合F,方法[4](148)如下:
步驟1:對訓練集進行第R次隨機采樣,共采集m次,得到包含m個樣本的采樣集Dr={C1,C2,…,Cm},其中m為數據量,Ci為第i組數據,每組數據是一個長度為n+1的向量X={X1,…,Xi,…,Xn,Xn+1}(n=11),其中r的初始值是1,1≤r≤R。
步驟2:用采樣集Dr訓練第r個貝葉斯網,貝葉斯網包含n+1個變量,其中X1…Xn表示如前所述的電能表狀態屬性數據,Xn+1表示電能表狀態評分,有d種可能取值,如d=3(穩定、關注、預警),訓練貝葉斯網方法如下:
基于訓練數據集Dr={C1,C2,…,Cm}隨機生成若干個貝葉斯網,作為通過遺傳算法迭代確定最優貝葉斯網的初始種群Popr,其中r的初始值是0,設置的遺傳算法迭代數為r0,每個貝葉斯網作為所述初始種群Qr中的一個個體[11]。

(2)



步驟3:將步驟2生成的最優貝葉斯網加入到貝葉斯網絡集合F中。
從產生的R個貝葉斯網中選擇K個精度高的貝葉斯網組成新的集合?。方法如下:

(3)
式中,m表示貝葉斯網Bi和Bj的采樣集采樣的樣本數量。



步驟5:當連續兩次迭代中,所述K個簇均不發生變化或達到最大迭代次數L時,轉至步驟6,否則轉至步驟3繼續執行。
步驟6:從K個簇中的每一個簇里選擇精度最高的貝葉斯網,以得到新的貝葉斯網集合?={?1,?2,…,?k}。
采用凸函數證據理論方法[14],對?中的貝葉斯網進行集成,進而得到狀態評價結果(見圖2)。假定x1,x2,…,xn表示當前觀測到的已知的指標屬性值,Y表示電能表狀態。方法如下:

圖2 使用?中的貝葉斯網進行狀態評價
步驟1:對于集合?中的貝葉斯網?1,當x1,x2,…,xn表示實際觀測到的評價智能電能表運行狀態的n個指標的數值,Yl表示智能電能表的運行狀態d種可能取值中的第l種,則計算智能電能表的運行狀態Yl的概率λ1(sl)的公式為:
λ1(sl)=P(Yl|x1,x2,…,xn)=P(Yl|πY)·
(4)
式中,1≤l≤d,1≤i≤n+1,Xi∈Children(Y)表示電能表的屬性指標Xi是運行狀態Y的子節點,πY是運行狀態Y的父節點。
步驟2:對于集合?中的貝葉斯網?j,當x1,x2,…,xn表示實際觀測到的評價智能電能表運行狀態的n個指標的數值,Yl表示智能電能表的運行狀態d種可能取值中的第l種,則計算智能電能表的運行狀態Yl的概率λj(sl)的公式為:
λj(sl)=P(Yl|x1,x2,…,xn)=P(Yl|πY)·
(5)
式中,2≤j≤K,j的初始值是2,Xi∈Children(Y)表示電能表的屬性指標Xi是運行狀態Y的子節點,πY是運行狀態Y的父節點。
步驟3:用下式將λ1(sl)和λj(sl)進行融合,并將結果賦給λ1(sl)。

(6)

步驟4:當j 步驟5:λ1(sl)即為每種可能的智能電能表運行狀態的概率值。 關于上式的推導有:設πY是節點Y的父節點,Children(Y)是節點Y的子節點。由貝葉斯網馬爾可夫覆蓋的特性,可知: P(Y|x1,x2,…,xn)=P(Y|MB(Y))= (7) 由于分母P(x1,x2,…,xn)并不包含Y,即無論Y取何值,P(x1,x2,…,xn)的值都相同,因此可以將分母看成常數。而且分子是聯合概率分布,那么可以把它表示成各節點的局部條件概率分布的乘積。因此,上式可以表示為: (8) 其中,c是常數。上式將各節點的局部條件概率分布分成3部分:Y的局部條件概率分布、Y的子節點的局部條件概率分布和其他節點的局部條件概率分布。由于第三部分∏Xj≠Y∩Xj?Children(Y)P(Xj|πXj)并不包含變量Y,所以這部分也可以歸到常數里,因此上式可以表示為: c·P(Y|πY)·∏Xi∈Children(Y)P(Xi|πY)·∏Xj≠Y∩Xj?Children(Y)P(Xj|πXj)=c'·P(Y|πY)·∏Xi∈Children(Y)P(Xi|πXi) (9) 從上式可以看到,P(Y|MB(Y))與P(Y|πY)·∏Xi∈Children(Y)P(Xi|πXi)成正比。 選用從江蘇、福建省分公司獲取的電能表運行狀態歷史數據集D。此數據集包含基本誤差、有功準確度等級、運行誤差、運行時間、運行故障率、監測異常、安裝環境、用戶信譽、家族缺陷、狀態評分等數據,表示為變量X1,X2,…,Xn(n=11)?;?.2中算法,結合集成學習思想,對電能表運行狀態歷史集D進行R次隨機采樣(R=10),形成R組數據集D1,D2,…,DR。運用機器學習的方法訓練出R個貝葉斯網模型B1,B2,…,BR;訓練出的每個貝葉斯網包含變量X1,X2,…,Xn,表示電能表運行指標數據與運行狀態的不確定性因果關系。 貝葉斯網的基本訓練原理是通過設計評分函數f(B,D)=P(D|B)來衡量貝葉斯網與數據集的擬合程度,然后運用啟發式搜索算法搜索貝葉斯網結構分值最高的一種,同時運用極大似然法來學習貝葉斯網中的參數,其過程如圖3所示。 圖3 貝葉斯網集成學習 基于2.3中算法,設計相似度函數估算任意兩個貝葉斯網在狀態評價上的相似度,基于K均值聚類對生成的R個貝葉斯網進行聚類,將其劃分為K(K 圖4 基于聚類的貝葉斯網選擇性集成 從每個簇中選擇精度最高的貝葉斯網,進而可以得到K=4個精度高、多樣性強的貝葉斯網B2、B4、B9、B10。 基于2.4中算法,使用上步選出的K個貝葉斯網作為融合模型,分別推理計算出電能表各狀態的概率值?;谕购瘮底C據理論融合各貝葉斯網的決策結果,獲得最終的狀態評價結果,其過程如圖5所示。 圖5 結合貝葉斯網和凸函數證據理論得出的最終評價結果 為了對智能電表的狀態進行高效而又準確的評價,課題組采取了智能電能表狀態評價數據集,利用此數據集分組進行智能電能表狀態評價貝葉斯網絡的構建,并利用集成學習思想提高其準確度,再通過凸函數理論進行最優貝葉斯網的融合,最終得出高效準確的貝葉斯網絡結構。利用貝葉斯網絡對智能電表的狀態評價方法相比傳統智能電表檢測方法節省了大量的人力和物力,降低了檢測成本,同時充分利用了采集的數據,使檢測結果更具科學性和準確性。實際研究表明,貝葉斯網絡對于智能電能表的狀態評價具有可行性,準確性也非常貼近實際檢測結果。但此模型仍存在以下不足:數據離散化不一導致的精確度問題。貝葉斯網路只能處理離散數據,因此在進行預測時要先將數據進行離散化,而數據離散化有多種方法,精確度不一,該文采用的為基于信息熵的數據離散化方法。因此以后要對如何進行數據離散化進行更加深入的探究。3 應用驗證



4 結束語