孟子杰,吳龍騰,蔡新雷,黎嘉明,梁升洪
(1.廣東電網(wǎng)調(diào)度控制中心,廣東廣州 510600;2.肇慶供電局電力調(diào)度控制中心,廣東 肇慶 526201)
智能配網(wǎng)安全和最優(yōu)經(jīng)濟運行是持續(xù)性研究的關(guān)鍵課題[1-2]。目前我國用電負荷日益攀升,供電短缺問題非常嚴重。電力調(diào)度是電力生產(chǎn)與分配的關(guān)鍵,在發(fā)電與供電企業(yè)中均占據(jù)重要地位[3]。調(diào)度員為電網(wǎng)操作者,肩負著電網(wǎng)穩(wěn)定安全運行的職責。各級別調(diào)度均規(guī)劃出嚴格的電力調(diào)度操作規(guī)范與記錄的填寫需求,下發(fā)每項調(diào)度命令前要謹慎填寫和打印調(diào)度命令票,調(diào)度命令票即為電網(wǎng)設(shè)備操作中最為核心的步驟[4]。
為確保調(diào)度命令票內(nèi)容嚴謹性與可靠性,該文在獲取調(diào)度文本內(nèi)容的同時,使用基于規(guī)則的設(shè)計標準,完成語義合規(guī)性校驗?zāi)P偷臉?gòu)建。
為準確校驗智能配網(wǎng)調(diào)度命令票語義合規(guī)性是否符合要求,首先采集調(diào)度命令票中的文本數(shù)據(jù)。將調(diào)度命令票數(shù)據(jù)作為研究目標,創(chuàng)建蟻群優(yōu)化下的文本數(shù)據(jù)采集方法。蟻群優(yōu)化算法包含如下步驟:更改信息素更新模式、增添信息素負載調(diào)節(jié)元素。
設(shè)定待處理文本集合為Task,可用服務(wù)器集合為M,分別描述為:

式中,Taski代表第i個任務(wù)僅在一個服務(wù)器內(nèi)接收,Mj是第j個服務(wù)器。
智能電網(wǎng)調(diào)度取決于待處理任務(wù)與服務(wù)器,對Task 和M采取笛卡爾積運算,獲得調(diào)度數(shù)據(jù)集合K。依照K值推算出調(diào)度命令票打印執(zhí)行時間,打印時間為T。
初始化蟻群優(yōu)化算法內(nèi)的啟發(fā)函數(shù)與信息素函數(shù),依次將兩個函數(shù)解析式記作:

信息素函數(shù)代表Taski分配至Mj的信息素濃度,Δτij為信息素增量,1-ρ是信息素濃度殘余量。在螞蟻k實現(xiàn)一次遍歷后,獲得遍歷選擇節(jié)點局部信息素更新后的增量值:

更新全局信息素最佳路徑增量,得到:

螞蟻b從目前節(jié)點i訪問下一個鄰近節(jié)點j的幾率是:

式中,α、β分別為螞蟻在打印調(diào)度命令票時路徑內(nèi)的殘余信息素與啟發(fā)式數(shù)據(jù)對智能電網(wǎng)調(diào)度的影響。
引入信息素負載調(diào)節(jié)元素[5],記載各臺服務(wù)器目前打印調(diào)度命令票的時間,將信息素函數(shù)改寫為:

對比全部螞蟻此次迭代內(nèi)的路徑,挑選最佳路徑,調(diào)節(jié)信息素[6],記載此次挑選的目前最優(yōu)解。憑借調(diào)整后的信息素與啟發(fā)式數(shù)據(jù)實施下一次搜尋,直至迭代終止。從迭代結(jié)果內(nèi)挑選最優(yōu)解,完成數(shù)據(jù)采集任務(wù)。
獲得調(diào)度命令票內(nèi)的文本數(shù)據(jù)后,使用k 均值聚類算法將具有相同特性的調(diào)度命令票語義內(nèi)容聚類在一起,減少后續(xù)校驗操作復(fù)雜度。k 均值聚類算法類屬聚類技術(shù)內(nèi)的基礎(chǔ)分類手段,擁有簡便快捷的計算優(yōu)勢。k 均值聚類算法將歐式距離當作相似度權(quán)衡標準,歐式距離計算公式記作:

式中,x1,x2,…,xn為文本數(shù)據(jù)的橫向序列,y1,y2,…,yn為文本數(shù)據(jù)的縱向序列。k 均值聚類算法使用偏差平方與準則函數(shù)[7]當作聚類標準,描述成:

其中,k表示要構(gòu)成聚類的數(shù)量,nj是第j類內(nèi)樣本數(shù)量,mj是第j類樣本平均值,也是此種類型集合的核心點:

從N個樣本數(shù)據(jù)目標任意擇取D個點當作原始聚類中心,針對其他剩余點,按照其自身和聚類中心的間距,依次將其配發(fā)至和自身最相近的聚類集合,再推算新聚類集合的聚類中心,按照相似度完成重新分配[8-9],重復(fù)執(zhí)行以上操作,直至各個簇中的對象不會發(fā)生改變?yōu)橹埂?/p>
研究傳統(tǒng)k 均值聚類算法可知,D值是預(yù)先設(shè)定的,在真實應(yīng)用中,D值的挑選過程難度很高,多數(shù)情況下無法獲得準確數(shù)值。k 均值聚類算法任意擇取原始聚類中心,致使很多的迭代結(jié)果精度不高[10]。下面對傳統(tǒng)k 均值聚類算法做出以下完善:
想獲取準確的聚類結(jié)果,最大限度維持每個聚類中心的間距為最大,因此,設(shè)計一個最遠距離下的原始聚類中心挑選方法。
最遠距離方法首先要獲取參加聚類的N個數(shù)據(jù)目前兩兩之間的間距,繼而構(gòu)造距離矩陣[11]。掃描矩陣擇取全部目前距離最遠的兩個點當作前兩個原始聚類中心。挑選不同的中心點,直至中心點數(shù)量與D值相等。利用余弦夾角推算矢量之間的相似度,將余弦夾角距離運算過程描述成:

矢量之間的相似度和余弦值為反比例關(guān)聯(lián),余弦值越高,表明兩個點的間距越小,反之兩點之間的距離越大。k 均值聚類算法的關(guān)鍵點是明確D值,也就是聚類數(shù)量。由于傳統(tǒng)方法缺少得到D值的先驗知識,因此對D值的計算難度較高。一般狀態(tài)下,聚類數(shù)量要遠低于樣本集合內(nèi)的目標總量,不然會削減后續(xù)校驗?zāi)P陀嬎憬Y(jié)果精度。該文使用和錯誤率相似的目標函數(shù)來完善調(diào)度命令票文本數(shù)據(jù)測量性能。
設(shè)定xi為第i個目標的矢量,ci∈{1,k}表示與之相呼應(yīng)的聚類索引,創(chuàng)建一個明確聚類D值的方法[12],即求解聚類平均值的總方差:

關(guān)于各個目標的矢量xi及其聚類平均值mci,算出N個文本的平方誤差均值E(k),更改k值,計算出三個聚類集合,并返回k 均值聚類算法。利用k值的改變對比目標函數(shù)值大小,挑選k值的基礎(chǔ)原則是增加k值,對應(yīng)的方差不會減小。
假如用戶不知曉智能配網(wǎng)調(diào)度命令票文本數(shù)據(jù)目標集合分布情況,就不能選定一個恰當?shù)腄值。改進后的k 均值聚類算法可完成簇個數(shù)D的自適應(yīng)評判,利用聚類結(jié)果及聚類均值方差總和獲得最優(yōu)聚類結(jié)果相應(yīng)的D值。對于N個文本目標聚類,其簇的個數(shù)一定低于D值。
通過上述計算過程,把調(diào)度命令票按特征分為不同的數(shù)據(jù)集合,此時要進一步對其進行合規(guī)性校驗。該文創(chuàng)建一個基于規(guī)則的語義合規(guī)性校驗?zāi)P停到y(tǒng)性分析模型構(gòu)建過程及其性能。
針對普通用戶,模型供應(yīng)的圖像界面配備規(guī)則文件,具備可擴展標記語言基礎(chǔ)知識的用戶,采用規(guī)則描述文檔[13],模仿可擴展標記語言文件模式直接完成校驗工作;具備相關(guān)編程知識的用戶,則能創(chuàng)建專屬的規(guī)則類,拓寬規(guī)則類型,使語義合規(guī)性校驗的應(yīng)用范圍更加廣泛,降低校驗失誤的可能性。
所建模型包含數(shù)據(jù)格式變換、重復(fù)記錄辨別、規(guī)則設(shè)定和分析、數(shù)據(jù)校驗、結(jié)果顯示和交互等模塊,模型運行過程如圖1 所示。

圖1 語義合規(guī)性校驗?zāi)P瓦\行過程
3.2.1 數(shù)據(jù)格式變換
用戶挑選需要校驗的調(diào)度命令票數(shù)據(jù)項,加載相對的數(shù)據(jù)表、Excel 數(shù)據(jù)表,通過數(shù)據(jù)格式變換模塊將數(shù)據(jù)表封裝成Java 數(shù)據(jù)目標列表[14]。數(shù)據(jù)變換操作中,還能挖掘調(diào)度命令的調(diào)度類型錯誤,變換流程如圖2 所示。

圖2 數(shù)據(jù)格式變換流程示意圖
3.2.2 重復(fù)記錄辨別與規(guī)則設(shè)定
按照編輯距離和距離算法,尋找相似度較多的記錄,讓用戶估算是否具備多次錄入狀況。
在用戶設(shè)定的校驗規(guī)范內(nèi),某些值源自往年觀測數(shù)據(jù)的平均值、最高值、最低值、空間變異等統(tǒng)計變量,用戶按照自己對網(wǎng)絡(luò)的熟練程度,使用不同的層次設(shè)定,拓展原始規(guī)則庫。
3.2.3 數(shù)據(jù)校驗與輸出
憑借用戶自定義的規(guī)則,對數(shù)據(jù)表實施校驗,同時把校驗結(jié)果記錄至各個錯誤列表內(nèi)。數(shù)據(jù)輸出過程中,用戶根據(jù)校驗結(jié)果,挑選是否進行校驗值輸出,輸出包含兩種模式[15]:一是以Excel 表的模式導(dǎo)出并引入語義合規(guī)性校驗結(jié)果的Excel 文件;二是把數(shù)據(jù)輸出值儲存在數(shù)據(jù)庫。數(shù)據(jù)輸出前,用戶首先編輯規(guī)則,然后進行校驗,直到輸出準確的合規(guī)性校驗結(jié)果。
規(guī)則引擎架構(gòu)如圖3 所示。

圖3 規(guī)則引擎架構(gòu)
模型設(shè)計使用規(guī)則定義語言,規(guī)則定義語言是在模板語言前提下,實施二次改造開發(fā)得到的。規(guī)則定義語言可以在校準過程中,準許人為控制變量,動態(tài)地把語義本文引入模板內(nèi)替換任意變量,確保在不同環(huán)境下的高效率應(yīng)用。其次是規(guī)則分析技術(shù)與背景知識庫技術(shù)。通過解析模式串后返回的字符串判斷是否滿足模式串描述的規(guī)則。背景知識庫技術(shù)中,通過專家描述文本語義數(shù)據(jù)格式、臨界值及作用于填充缺失值的某類數(shù)值,反復(fù)記錄度量規(guī)則,數(shù)據(jù)規(guī)則設(shè)定時要代入的關(guān)鍵值也源自背景知識庫。規(guī)則分發(fā)技術(shù)使用可擴展標記語言來描述,因此在每個校驗流程中均能完成自由分發(fā)[16]。
為檢測該文語義合規(guī)性校驗?zāi)P托阅艿膬?yōu)劣[17],對其進行仿真實驗分析,實驗計算機硬件環(huán)境是Intel(R)Core(TM)CUP T6600,2.2 GHz,仿真軟件是SimuWorks。
圖4 為該文方法與文獻[14]、文獻[15]的語義合規(guī)性校驗輸出頻譜的比較情況。

圖4 語義合規(guī)性數(shù)據(jù)校驗輸出頻譜對比圖
根據(jù)圖4 可知,文獻[14-15]方法語義合規(guī)性校驗受到冗余數(shù)據(jù)干擾較多,振幅頻度較高,這樣會大幅降低語義合規(guī)性校驗精度。而該文方法具備極強的抗干擾能力,旁瓣波束抑制性能也得到顯著增強,可以充分保證智能配電調(diào)度命令票語義規(guī)范性。出現(xiàn)此種現(xiàn)象的原因在于,該文方法采用k 均值聚類算法,可以快速精準分類文本信息,一旦校驗結(jié)果顯示某個數(shù)據(jù)為冗余數(shù)據(jù),則判斷該數(shù)據(jù)集合為冗余數(shù)據(jù)集合,從根本上剔除冗余數(shù)據(jù)對校驗的干擾。
為提升智能配網(wǎng)調(diào)度命令票文本語義規(guī)范性與準確性,設(shè)計基于規(guī)則的調(diào)度命令票語義合規(guī)性校驗?zāi)P汀Ec傳統(tǒng)方法相比,所建模型抗干擾能力強,校驗精度高,時延低,可充分保障調(diào)度命令票內(nèi)容的嚴謹性,提升調(diào)度員工作效率,為實現(xiàn)智能配網(wǎng)高質(zhì)量電力調(diào)度提供扎實基礎(chǔ)。