何宇雄 苑晉沛 聶宇 羅超
摘 要:電力調度自動化系統(tǒng)對電力數(shù)據(jù)的收集和整理工作質量有著較高要求,而為了滿足這一要求近年來數(shù)據(jù)挖掘技術日漸受到電力行業(yè)重視,基于此,文章就數(shù)據(jù)挖掘技術進行了簡單介紹,并對數(shù)據(jù)挖掘在電力調度自動化系統(tǒng)中的應用進行了深入論述,希望論述內容能夠為相關業(yè)內人士帶來一定啟發(fā)。
關鍵詞:數(shù)據(jù)挖掘;電力調度自動化系統(tǒng);周期性關聯(lián)規(guī)則挖掘算法
中圖分類號:TM734 文獻標志碼:A 文章編號:2095-2945(2018)04-0143-02
Abstract: Power dispatching automation system has higher requirements for the quality of power data collection and collation. In order to meet this requirement, data mining technology has been paid more and more attention in recent years. On the basis of this, this paper briefly introduces the technology of data mining, and discusses the application of data mining in power dispatching automation system in depth, hoping that the content of the discussion can bring some inspiration to the relevant industry.
Keywords: data mining; power dispatching automation system; periodic association rule mining algorithm
前言
電力數(shù)據(jù)收集、整理質量直接影響電力調度自動化系統(tǒng)的控制和管理水平,但由于很多價值較高的數(shù)據(jù)信息往往位于隱藏的數(shù)據(jù)之中,這就使得傳統(tǒng)方法不能較好滿足電力調度自動化系統(tǒng)需要,而為了解決這一問題,正是本文就數(shù)據(jù)挖掘在電力調度自動化系統(tǒng)中應用展開具體研究的原因所在。
1 數(shù)據(jù)挖掘技術
在大數(shù)據(jù)時代到來的今天,數(shù)據(jù)挖掘技術能夠從海量數(shù)據(jù)信息中準確找到所求信息,因此本文將數(shù)據(jù)挖掘技術視作“采用有效工具和措施從海量數(shù)據(jù)庫中提取數(shù)據(jù)和模型關系”的技術,由此企業(yè)的決策能夠得到充足的判斷依據(jù)。為了更直觀了解數(shù)據(jù)挖掘技術,本文將數(shù)據(jù)挖掘的過程和步驟概括為以下幾個方面:(1)確定業(yè)務對象。確定業(yè)務對象屬于數(shù)據(jù)挖掘過程的基礎工作,這一過程的實質是了解業(yè)務問題。(2)準備數(shù)據(jù)。通過選擇數(shù)據(jù)、數(shù)據(jù)預處理、轉換數(shù)據(jù)三個層面的工作,即可完成針對于挖掘算法的分析模型構建,并最終完成一定領域的數(shù)據(jù)挖掘。
2 數(shù)據(jù)挖掘在電力調度自動化系統(tǒng)中的應用
2.1 應用方式
神經(jīng)網(wǎng)絡、灰色分析法、關聯(lián)規(guī)則均能夠用于電力調度自動化系統(tǒng)的數(shù)據(jù)挖掘,具體應用如下所示。
(1)神經(jīng)網(wǎng)絡。作為應用較為廣泛的一種人工智能研究方法,神經(jīng)網(wǎng)絡早已在我國實現(xiàn)了較為廣泛的應用,電力調度自動化系統(tǒng)的數(shù)據(jù)挖掘也是其應用的重要領域,由于數(shù)據(jù)自行處理、數(shù)據(jù)分布存儲、高度容錯性是神經(jīng)網(wǎng)絡的應用優(yōu)勢所在,這就使得神經(jīng)網(wǎng)絡較為適用于模糊、不完整、不準確數(shù)據(jù)的處理。在電力調度自動化系統(tǒng)的數(shù)據(jù)挖掘中,神經(jīng)網(wǎng)絡主要通過關聯(lián)分析的方式實現(xiàn)數(shù)據(jù)邏輯處理,具體處理可以分為以下幾個方面:a.整合統(tǒng)一基礎數(shù)據(jù)。由于電力調度自動化系統(tǒng)包含的數(shù)據(jù)具備龐大復雜、種類繁多的特點,因此神經(jīng)網(wǎng)絡的應用需要通過整合統(tǒng)一使相關數(shù)據(jù)形成結構模型,通過神經(jīng)網(wǎng)絡系統(tǒng)實現(xiàn)數(shù)據(jù)統(tǒng)一管理。b.實現(xiàn)不同環(huán)節(jié)電力調度的關聯(lián)。應用數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡方法整理不同環(huán)節(jié)的電流狀態(tài)和參數(shù),并保證相關數(shù)據(jù)信息的整合性,即可實現(xiàn)不同環(huán)節(jié)電力調度的關聯(lián)。c.分析與決策。結合神經(jīng)網(wǎng)絡整理的整合數(shù)據(jù),即可開展分析、決策以及數(shù)據(jù)共享。(2)灰色分析法。灰色分析法能夠較好分析電力調度過程出現(xiàn)的不完整數(shù)據(jù),但不適用于較為龐大的數(shù)據(jù)是該數(shù)據(jù)挖掘方法存在的不足。一般情況下,灰色分析法的應用需要深入了解設備數(shù)據(jù)參數(shù),如用戶用電情況預測、母線負荷數(shù)據(jù)值、電力銷售情況預測等,結合分析確定電力調度邊界電量,即可提升數(shù)據(jù)收集的可靠性,電力調度自動化系統(tǒng)的運行也將由此獲得較為有力的支持。(3)關聯(lián)規(guī)則。作為數(shù)據(jù)挖掘的重要分支,關聯(lián)規(guī)則能夠通過發(fā)覺大量數(shù)據(jù)項集之間的有趣關聯(lián)和相互聯(lián)系實現(xiàn)信息的高質量分析,剛剛提到的神經(jīng)網(wǎng)絡嚴格意義上也屬于關聯(lián)規(guī)則范疇,不過本文關于關聯(lián)規(guī)則的研究主要圍繞周期性關聯(lián)規(guī)則挖掘算法展開。周期性關聯(lián)規(guī)則挖掘算法具備掃描數(shù)據(jù)庫次數(shù)較少、避免掃描數(shù)據(jù)庫的時間開銷、連接程序中相同項目的比較次數(shù)較少、數(shù)據(jù)項集頻度統(tǒng)計速度較高等優(yōu)勢,由此實現(xiàn)的周期性數(shù)據(jù)集挖掘、關聯(lián)規(guī)則挖掘便能夠大大降低電力調度自動化系統(tǒng)的事故發(fā)生概率。
值得注意的是,本文研究的周期性關聯(lián)規(guī)則挖掘算法結合了蟻群算法,這是由于原算法使用了大量的搜索操作、分類檢索和路徑檢索,蟻群算法下走過的路上會留下信息素,這就使得較短路徑上的信息素濃度較高,結合負信息素理論,即可保證有信息素的地方螞蟻不能走過。如使用表1所示的事務數(shù)據(jù)庫D(部分),即可結合時態(tài)事務數(shù)據(jù)庫D分類數(shù)據(jù)集改進、每一個分類數(shù)據(jù)集周期性數(shù)據(jù)集挖掘改進,以數(shù)據(jù)項A分類為例,即可求得表2所示的時態(tài)屬性差,由此開展更深入計算則能夠更深入了解周期性關聯(lián)規(guī)則挖掘算法的思想,也能夠認識到蟻群算法的重要性。
2.2 應用實踐
為提升研究實踐價值,本文圍繞周期性關聯(lián)規(guī)則挖掘算法建立了基于周期性關聯(lián)規(guī)則挖掘的數(shù)據(jù)分析系統(tǒng),這一系統(tǒng)的建立過程如下所示。(1)開發(fā)平臺選擇。結合系統(tǒng)功能需要,選擇了微軟的.net平臺作為主要系統(tǒng)開發(fā)平臺,該平臺具備的強大數(shù)據(jù)庫訪問能力、擴展豐富等特點,能夠較好滿足系統(tǒng)開發(fā)需要。(2)基于數(shù)據(jù)橋的數(shù)據(jù)集成模塊設計。考慮到我國當下電力事業(yè)的數(shù)據(jù)集成標準較為復雜、混亂,系統(tǒng)設計采用了自己的數(shù)據(jù)集成方法,同時應用了清晰數(shù)據(jù)清洗策略,由此即可實現(xiàn)不完整數(shù)據(jù)、重復數(shù)據(jù)、錯誤數(shù)據(jù)三類臟數(shù)據(jù)的清洗,數(shù)字數(shù)據(jù)不完整、日期數(shù)據(jù)不完整、錯誤日期型數(shù)據(jù)、重復數(shù)據(jù)等僅屬于清洗內容,其中除重復數(shù)據(jù)不予處理外,其他數(shù)據(jù)均采用修補空值和默認值的方式,如數(shù)字數(shù)據(jù)不完整采用“補0,補null,默認值”的清洗策略。此外,無類型文件數(shù)據(jù)集成、數(shù)據(jù)庫數(shù)據(jù)集成、異構數(shù)據(jù)庫數(shù)據(jù)集成也是這一環(huán)節(jié)設計的重要內容[3]。(3)數(shù)據(jù)庫管理模塊設計。采用微軟公司的SQL Server數(shù)據(jù)庫系統(tǒng),由此數(shù)據(jù)庫管理被分為層次數(shù)建模、數(shù)據(jù)表管理、數(shù)據(jù)表導出三部分,其中數(shù)據(jù)表管理包含數(shù)據(jù)管理、結構管理、刪除三方面功能,而數(shù)據(jù)表導出則包括文本文件、Excel文件、Access文件、Xml文件、其他數(shù)據(jù)庫五部分內容。(4)數(shù)據(jù)分析功能模塊設計。數(shù)據(jù)分析功能模塊由同期數(shù)據(jù)分析、周期性數(shù)據(jù)分析、數(shù)據(jù)預警分析、數(shù)據(jù)關聯(lián)分析四部分組成,各部分設計如下所示:a.同期數(shù)據(jù)分析模塊設計。該模塊的運行流程主要由負荷數(shù)據(jù)、網(wǎng)損數(shù)據(jù)、力率數(shù)據(jù)、有功總加數(shù)據(jù)對比組成,分析流程可以概括為:“輸入所有對比條件→合法→根據(jù)條件生成SQL語句→顯示查詢結果→打印對比圖像”。b.周期性數(shù)據(jù)分析模塊設計。圍繞報警周期性、負荷周期性、遙測周期性三方面開展數(shù)據(jù)挖掘,即可完成該模塊設計。c.數(shù)據(jù)預警分析模塊設計。分析流程為:“初始化數(shù)據(jù)集及參數(shù)→輸入預警分析參數(shù)→合法→分析預測→判斷預測類型→有無建議→輸出報警類型和建議→輸出報警類型”。d.數(shù)據(jù)關聯(lián)分析模型設計。采用默認用戶手動輸入數(shù)據(jù)集方法,程序流程為:“初始化已有周期性數(shù)據(jù)集→輸入?yún)?shù)→合法?→數(shù)據(jù)集交叉?→計算Conf、Sup→計算下一對數(shù)據(jù)集→完成”。
3 結束語
數(shù)據(jù)挖掘能夠較好地服務于電力調度自動化系統(tǒng)。而在此基礎上,本文研究建立的基于周期性關聯(lián)規(guī)則挖掘的數(shù)據(jù)分析系統(tǒng),則證明了研究的實踐價值。因此,在相關領域的理論研究和實踐探索中,本文內容能夠發(fā)揮一定參考作用。
參考文獻:
[1]王謙,李烽.電力調度的自動化網(wǎng)絡安全分析及實現(xiàn)[J].電子技術與軟件工程,2017(21):116.
[2]劉賓,朱亞奇,吳莎.數(shù)據(jù)挖掘在電力調度自動化系統(tǒng)中的應用[J].電子技術與軟件工程,2017(20):158.
[3]曹鐵生.電力調度自動化系統(tǒng)應用現(xiàn)狀與發(fā)展趨勢研究分析[J].硅谷,2014,7(23):74+76.
[4]周洋.數(shù)據(jù)挖掘在電力調度自動化系統(tǒng)中的應用解析[J].科技創(chuàng)新與應用,2017(35):149-150.
[5]李夢鳴.大數(shù)據(jù)挖掘平臺在電力運營監(jiān)測工作的應用[J].科技創(chuàng)新與應用,2016(26):21-22.endprint